A mineração de dados (data mining) é uma das etapas do proce...
decisão.
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Gabarito: E (Errado)
1. Tema central da questão:
O foco está em mineração de dados (data mining), especialmente sobre o conceito de previsão nas etapas do processo de descoberta de conhecimento em banco de dados (KDD - Knowledge Discovery in Databases). A questão exige a compreensão das diferenças entre técnicas de previsão (prediction) e classificação (classification).
2. Resumo teórico:
O processo de KDD inclui várias etapas: seleção, pré-processamento, transformação, mineração de dados e interpretação/avaliação. Durante a mineração de dados, usamos técnicas como classificação, regressão, agrupamento (clustering), entre outras (Fayyad et al., 1996).
A classificação cria modelos para separar dados em categorias ou classes distintas. Já a previsão é usada para estimar valores futuros ou desconhecidos geralmente numéricos, como receitas, temperaturas, etc.
3. Justificativa para o gabarito (Errado):
A afirmação descreve a técnica de previsão como sendo responsável por repartir os dados em diferentes classes ou categorias. Porém, isso é típico da técnica de classificação e não de previsão. Previsão está ligada à estimativa de valores futuros, geralmente contínuos, enquanto classificação trata de categorias.
Assim, a assertiva está errada, pois confunde os conceitos fundamentais dessas técnicas.
4. Estratégias de interpretação:
Quando a questão menciona "repartir os dados em diferentes classes ou categorias", procure relacionar isso à classificação e não à previsão. Pegadinhas comuns em provas de concurso envolvem inverter conceitos ou nomes similares. Leia atentamente a definição de cada técnica antes de marcar sua opção.
Gostou do comentário? Deixe sua avaliação aqui embaixo!
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
Para quem não entendeu, segue abaixo um resumo mais detalhado que esquematiza essas técnicas e o processo de descoberta:
Etapas do processo de descoberta de conhecimento (Knowledge discovery in Database - KDD):
Entrada de Dados -> Pré-processamento -> Mineração -> Pós-processamento -> Informação
1. Pré-processamento
(seleção de atributos, redução de dimensionalidade, normalização, amostragem)
2. Mineração
(Aplicação de algoritmos de aprendizado por máquina):
Técnicas: < Classificação - Agrupamento - Anomalias - Associações >
2.1 Classificação,
ou classificação supervisionada: O conjunto de treinamento já possui uma classe. E.g.: Predizer espécie de uma flor dadas as características dela.
2.2 Agrupamento (Clustering):
O conjunto de treinamento não possui classe e é aprendido automaticamente pelo algoritmo, e.g. descoberta de centróides.
2.3 Anomalias (Anomaly Detection):
Aprende um padrão e detecta casos que extrapolam esse padrão, e.g. análise de fraude em cartões de crédito.
2.4 Associação (Association Analysis):
Aprende padrão de associação entre certos atributos e deriva uma regra, e.g. market basket analysis no Walmart - quem compra cerveja compra fraldas.
3. Pós-processamento
(Filtragem de padrões, visualização, interpretação de padrões).
Fonte: Tan et al, Introdução ao Data Mining.
Nesse caso Previsão = Pediçaõ é uma meta e não uma etapa. Portanto resposta: ERRADO
Creio que seria uma técnica de descrição e não de previsão...
É realmente uma das etapas do KDD(Knowledge Discovery in Databases – Descoberta de Conhecimento em Bancos de Dados). No entanto, a técnica de repartir os dados de modo que diferentes classes ou categorias possam ser identificadas com base em combinações de parâmetros é, na verdade, a técnica de classificação e, não, previsão.
Gabarito: Errado
Previsão é um dos objetivos da mineração de dados. Sendo eles: predição, identificação, classificação e otimização. (P I C O)
Já o que está descrição é uma técnica - especificação de como descobrir padrões- PREDITIVA de CLASSIFICAÇÃO. Essa última consiste em: cada instância ser dividida em coleções de atributos, que visa estabelecer categorias pré definidas antes da análise de dados a partir de conjunto de outros dados, bem como a distribuição dos dados nas categorias estabelecidas.
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo