Questões de Concurso Público ANM 2025 para Especialista em Recursos Minerais - Especialidade: Tecnologia da Informação - Ciência de Dados
Foram encontradas 120 questões
Em SQL, a instrução mais simples para selecionar registros de uma tabela é composta pelas cláusulas SELECT e WHERE.
Em um banco de dados relacional, a cláusula UNIQUE deve ser aplicada a chaves alternativas, que não a chave primária, para garantir a não duplicidade da chave alternativa.
Os triggers são baseados no modelo evento-condição-ação, no qual um evento no banco de dados dispara uma ação quando determinada condição é atingida.
Quando todas as colunas não chave de uma tabela dependem de toda a chave composta, essa tabela está na segunda forma normal (2FN).
No diagrama entidade relacionamento (DER), as interações entre dois atributos são representadas pelos relacionamentos entre si.
Em BI, a informação é o resultado da organização dos dados, ao passo que o conhecimento é a geração de valor com a informação.
No ETL, a qualificação de dados engloba o processo de conformidade, no qual são identificados registros repetidos.
Bancos de dados utilizados em data warehouses empregam uma modelagem específica e otimizada, denominada modelagem multidimensional.
Durante a fase de data preparation (preparação dos dados) do modelo CRISP-DM, é necessário que todos os dados sejam normalizados e transformados em variáveis numéricas, independentemente de sua natureza original, para facilitar a análise posterior.
Arquivos CSV devem obrigatoriamente incluir um cabeçalho na primeira linha para identificar os campos.
A tecnologia JSON permite a aninhamento de objetos e arrays, possibilitando a construção de estruturas de dados complexas.
No modelo CRISP-DM, durante a fase de evaluation (avaliação), os resultados do modelo são comparados com os objetivos do negócio para determinar sua eficácia e adequação.
A cláusula GROUP BY, do SQL, pode ser utilizada sem a presença de funções agregadas, desde que haja uma cláusula ORDER BY para organizar os resultados da consulta.
Para excluir uma tabela na linguagem SQL e liberar os recursos alocados por ela, inclusive índices e triggers associados, deve-se fazer uso do comando DELETE TABLE, pois ele remove tanto os dados quanto a estrutura da tabela.
Para reconhecer padrões de ocorrência que se repetem em determinados conjuntos de dados, como, por exemplo, padrões de consumo, é usado o método de data mining denominado associação.
O overfitting ocorre quando um modelo de machine learning tem alta precisão nos dados de treinamento, mas apresenta desempenho significativamente pior em novos dados.
A única maneira de se evitar o underfitting em um modelo de machine learning é reduzir a quantidade de dados de entrada, pois isso impede que o modelo fique sobrecarregado de informações irrelevantes.
O uso de GPUs e TPUs acelera os cálculos necessários para operações matriciais e retropropagação em modelos de deep learning.
A regressão é o método de data mining usado para prever valores contínuos como, por exemplo, previsão de vendas, preços de ações, identificação de transações fraudulentas, entre outros.
O deep learning elimina completamente a necessidade de pré-processamento de dados, pois as redes neurais são capazes de aprender todas as características automaticamente.