Foram encontradas 916 questões
Resolva questões gratuitamente!
Junte-se a mais de 4 milhões de concurseiros!
Considere ainda a tabela a seguir, que contém índices calculados de confiabilidade para quantidades previstas de erros e níveis de confiança.
A partir dos dados apresentados e para cumprir os critérios previamente definidos, o tamanho da amostra para o teste na população indicada deve ser de:
Na situação hipotética de um trabalho de auditoria que tem por objeto a concessão de auxílio financeiro emergencial a pessoas que perderam renda em decorrência de uma epidemia que atingiu o país e afetou a economia, a matriz de planejamento:
O classificador em questão foi treinado em um conjunto de dados particionado (holdout) em 60%/30%/10% (treinamento/validação/ teste). Entretanto, os especialistas envolvidos consideraram o modelo obtido insatisfatório após analisarem o gráfico.
Considerando essas informações, duas técnicas que poderiam ser utilizadas para contornar o problema encontrado são:
Das alternativas abaixo, aquela que lista apenas os modelos compatíveis com essa estratégia de caching é:
São exemplos: a) de identificadores explícitos, b) de identificadores sensíveis e c) de quasi identificadores:
A alta administração da YEDU decidiu então implementar um programa de Gestão e Governança de Dados. Para resolver o problema de repetições de dados de alunos na YEDU, o CDO (Chief Data Officer) definiu corretamente a seguinte abordagem:
A = “Há pessoas que choram por saber que as rosas têm espinho” B = “Há outras que sorriem por saber que os espinhos têm rosas”
A submatriz da matriz de TF-IDF desses dois documentos correspondente aos termos “Rosas”, “Choram” e “Sorriem”, nessa ordem, é:
dados = tibble::tibble(Analista=c(“A1”, “A1”, “A1”, “A2”, “A2”, “A3”, “A3”, “A3”),
Ano=c(2018,2019,2020,2019,2020,2018,2019,2020), Processos=c(10,15,20,25,20,8,7,12))
Um programador roda o código abaixo em R.
tidyr::pivot_wider(data=dados, names_from=”Analista”, values_from=”Processos”)
Os valores esperados na primeira linha do objeto resultante do comando acima são:
Para pesos w1 = 2, w2 = 3 e viés w0 = 1, a região de classificação é uma reta que passa nos pontos:
A partição que apresenta o menor erro de classificação quando feita na raiz (primeiro nível) de uma árvore de decisão é:
Esse analista gostaria de prever a classe dos pontos (1,1), (0,0) e (-1,2) usando o algoritmo de k-vizinhos mais próximos com k=3 e usando a distância euclidiana usual.
Suas classes previstas são, respectivamente:
ATENÇÃO!
Para a questão a seguir, considere uma tabela relacional R, com atributos W, X, Y, Z, e o conjunto de dependências funcionais identificadas para esses atributos.
X → Y
X → Z
Z → X
Z → W

De acordo com as dependências funcionais de R, e com a Forma Normal de Boyce-Codd, a definição correta das chaves (por meio de constraints) aplicáveis e necessárias para essa tabela deveria ser:
ATENÇÃO!
Para a questão a seguir, considere uma tabela relacional R, com atributos W, X, Y, Z, e o conjunto de dependências funcionais identificadas para esses atributos.
X → Y
X → Z
Z → X
Z → W
(1) X → Y Z W (2) X → W (3) X W → Y W (4) X Y Z W → X Y (5) Y → Z
À luz dos axiomas da teoria de projeto de bancos de dados aplicáveis nesse caso, é correto concluir que, dentre essas dependências inferidas:
Como esses dados são categóricos, Natasha faz um pré-processamento usando a biblioteca scikit-learn. Em um ambiente interativo, ela executa os comandos a seguir.
>>> from sklearn.preprocessing import OneHotEncoder >>> enc = OneHotEncoder() >>> X = [['Toyota', 'vermelho'], ['Toyota', 'verde'], ['BMW', 'vermelho']]
>>> enc.fit(X) >>> enc.get_feature_names() array(['x0_BMW', 'x0_Toyota', 'x1_verde', 'x1_vermelho'], dtype=object)
>>> X_prime = enc.transform(X).toarray() >>> X_prime array([[0., 1., 0., 1.], [0., 1., 1., 0.], [1., 0., 0., 1.]])
Para contar o número de carros da marca Toyota no conjunto de dados, obtendo corretamente o resultado 2, Natasha pode usar a seguinte linha de código:

A execução desse código na IDLE Shell produz, na ordem e exclusivamente, os números:
ATENÇÃO!
Na próxima questão, considere as tabelas de banco de dados T, TX e DUAL, exibidas com suas respectivas instâncias a seguir.
T



(1) select * from dual where x = null (2) select * from dual where x <> null (3) select * from dual where x > 10 (4) select * from dual where not x > 10 (5) select * from dual where x > 10 union select * from dual where x <= 10
Se os resultados desses comandos fossem separados em grupos homogêneos, de modo que em cada grupo todos sejam idênticos e distintos dos elementos dos demais grupos, haveria:
ATENÇÃO!
Na próxima questão, considere as tabelas de banco de dados T, TX e DUAL, exibidas com suas respectivas instâncias a seguir.
T



O comando SQL que produz o resultado acima, a partir da instância inicialmente definida para a tabela T, é: