Questões de Concurso
Comentadas sobre data mining em banco de dados
Foram encontradas 523 questões
Julgue o item a seguir, relativo ao modelo CRISP-DM (cross industry standard process for data mining).
Compreensão do negócio, compreensão dos dados, preparação dos dados, modelagem, avaliação e implantação são as fases do modelo CRISP-DM, e, nesse modelo, as fases devem ser seguidas de maneira estritamente sequencial, sem a possibilidade de iterações ou retrocessos.
A regressão é o método de data mining usado para prever valores contínuos como, por exemplo, previsão de vendas, preços de ações, identificação de transações fraudulentas, entre outros.
Para reconhecer padrões de ocorrência que se repetem em determinados conjuntos de dados, como, por exemplo, padrões de consumo, é usado o método de data mining denominado associação.
No modelo CRISP-DM, durante a fase de evaluation (avaliação), os resultados do modelo são comparados com os objetivos do negócio para determinar sua eficácia e adequação.
Durante a fase de data preparation (preparação dos dados) do modelo CRISP-DM, é necessário que todos os dados sejam normalizados e transformados em variáveis numéricas, independentemente de sua natureza original, para facilitar a análise posterior.
Julgue o próximo item, relativo a data analytics e ferramentas de análise de dados.
Data analytics está associada à camada quantitativa, visto que os dados são o principal insumo no processo de tomada de decisão, principalmente no âmbito empresarial.
Julgue o próximo item, relativo a data analytics e ferramentas de análise de dados.
A tomada de decisão passou a ser mais dinâmica nos atuais mercados, devido, entre outros aspectos, ao volume disponível de dados e aos cenários possíveis.
Julgue o próximo item, relativo a data analytics e ferramentas de análise de dados.
A tecnologia para tratamento de dados prescinde da participação humana, quando considerada a tomada de decisão na organização.
Julgue o próximo item, relativo a data analytics e ferramentas de análise de dados.
A camada qualitativa na tomada de decisão representa um desafio para a gestão, no que tange à resolutividade organizacional.
Em relação a manipulação e limpeza de dados, julgue o item a seguir.
A transformação de dados categóricos utilizando codificação one-hot sempre reduz a dimensionalidade do conjunto de dados.
Em relação a manipulação e limpeza de dados, julgue o item a seguir.
A normalização dos dados é importante na preparação de dados para modelos de aprendizado de máquina, pois garante que todas as variáveis estejam na mesma escala, independentemente de sua importância no modelo.
Em relação a manipulação e limpeza de dados, julgue o item a seguir.
Local outlier factor é uma técnica de detecção de outliers que mede a anomalia de um dado com base na densidade local dos seus vizinhos.
Julgue o próximo item, a respeito de machine leaning.
Árvores de decisão são técnicas de modelagem preditiva que particionam iterativamente os dados em subconjuntos homogêneos baseados em variáveis explicativas.
Julgue o próximo item, a respeito de machine leaning.
Os algoritmos de regressão linear, por minimizarem a soma dos resíduos quadrados para ajustar os coeficientes, são sensíveis a outliers, que podem distorcer os coeficientes e comprometer a previsão do modelo.
Julgue o próximo item, a respeito de machine leaning.
Grandes volumes de dados frequentemente revelam padrões e tendências que são valiosos para análises preditivas e tomadas de decisão, facilitando a antecipação de comportamentos futuros e permitindo melhor alocação de recursos e planejamento.
( ) K-means, também conhecido como K-NN, é um algoritmo baseado na ideia de que objetos semelhantes estão próximos uns dos outros.
( )Árvore de decisão é uma estrutura hierárquica constituída por nós. Nela, o coeficiente de Gini de um nó é sempre maior do que o do seu nó pai.
( ) O algoritmo SVM, utilizado apenas para a tarefa de classificação, emprega classificadores lineares que separam o conjunto de dados por meio de hiperplanos, não sendo possível seu uso com problemas não linearmente separáveis.
As afirmativas são, respectivamente,
( ) Uma árvore de decisão é um grafo cíclico direcionado em que cada nó é um nó de divisão.
( ) Em uma rede neural artificial multicamadas os neurônios estão conectados a todos os neurônios da camada anterior.
( ) As máquinas de vetores de suporte (SVM - Support Vector Machine) são aplicadas em problemas de classificação nos quais busca-se dividir os dados por meio de um hiperplano.
As afirmativas são, respectivamente,
A respeito de data mart e data mining, julgue o item a seguir.
O uso de data mining permite, por exemplo, que uma empresa de varejo descubra padrões de compra ocultos em grandes volumes de dados, permitindo que a empresa crie promoções direcionadas ou ajuste o leiaute da loja para aumentar as vendas.