Questões de Concurso
Comentadas para anm
Foram encontradas 1.695 questões
Resolva questões gratuitamente!
Junte-se a mais de 4 milhões de concurseiros!
O deep learning elimina completamente a necessidade de pré-processamento de dados, pois as redes neurais são capazes de aprender todas as características automaticamente.
A regressão é o método de data mining usado para prever valores contínuos como, por exemplo, previsão de vendas, preços de ações, identificação de transações fraudulentas, entre outros.
O uso de GPUs e TPUs acelera os cálculos necessários para operações matriciais e retropropagação em modelos de deep learning.
A única maneira de se evitar o underfitting em um modelo de machine learning é reduzir a quantidade de dados de entrada, pois isso impede que o modelo fique sobrecarregado de informações irrelevantes.
O overfitting ocorre quando um modelo de machine learning tem alta precisão nos dados de treinamento, mas apresenta desempenho significativamente pior em novos dados.
Para reconhecer padrões de ocorrência que se repetem em determinados conjuntos de dados, como, por exemplo, padrões de consumo, é usado o método de data mining denominado associação.
Para excluir uma tabela na linguagem SQL e liberar os recursos alocados por ela, inclusive índices e triggers associados, deve-se fazer uso do comando DELETE TABLE, pois ele remove tanto os dados quanto a estrutura da tabela.
A cláusula GROUP BY, do SQL, pode ser utilizada sem a presença de funções agregadas, desde que haja uma cláusula ORDER BY para organizar os resultados da consulta.
No modelo CRISP-DM, durante a fase de evaluation (avaliação), os resultados do modelo são comparados com os objetivos do negócio para determinar sua eficácia e adequação.
A tecnologia JSON permite a aninhamento de objetos e arrays, possibilitando a construção de estruturas de dados complexas.
Arquivos CSV devem obrigatoriamente incluir um cabeçalho na primeira linha para identificar os campos.
Durante a fase de data preparation (preparação dos dados) do modelo CRISP-DM, é necessário que todos os dados sejam normalizados e transformados em variáveis numéricas, independentemente de sua natureza original, para facilitar a análise posterior.
Bancos de dados utilizados em data warehouses empregam uma modelagem específica e otimizada, denominada modelagem multidimensional.
No ETL, a qualificação de dados engloba o processo de conformidade, no qual são identificados registros repetidos.
Em BI, a informação é o resultado da organização dos dados, ao passo que o conhecimento é a geração de valor com a informação.
Os triggers são baseados no modelo evento-condição-ação, no qual um evento no banco de dados dispara uma ação quando determinada condição é atingida.
Em SQL, a instrução mais simples para selecionar registros de uma tabela é composta pelas cláusulas SELECT e WHERE.
Uma nuvem privada do tipo VPC (virtual private cloud) pode ser instalada em um provedor público.
O ChatGPT e o DeepSeek são plataformas de IA generativas baseadas em modelos de linguagem de grande escala (LLMs — large language models) e o princípio tecnológico dessas plataformas é a arquitetura transformer, que ajuda o modelo a aprender as relações entre palavras e frases em longos trechos de texto.
Um prompt é um conjunto de instruções que o modelo generativo utiliza para prever a resposta desejada.