Avalie as sentenças sobre Mineração de Dados: I – A mineraç...

Próximas questões
Com base no mesmo assunto
Q3541844 Banco de Dados
Avalie as sentenças sobre Mineração de Dados:

I – A mineração de dados é uma disciplina exclusiva da engenharia da computação, utilizada como ferramenta por demais áreas de conhecimento.
II – As tarefas descritivas da mineração de dados fazem inferência a partir dos dados e possuem o objetivo de realizar predições.
III – Durante as tarefas de mineração de dados, os valores de dados outliers não podem ser descartados, para garantir a fidedignidade do modelo em uso.

Conforme Castro e Ferrari (2016), é CORRETO afirmar que:
Alternativas

Gabarito comentado

Confira o gabarito comentado por um dos nossos professores

Alternativa correta: E - Todas as sentenças são falsas.

1. Tema central da questão

Esta questão trata dos conceitos fundamentais de Mineração de Dados (Data Mining), especialmente das suas tarefas, abrangência e práticas relacionadas à preparação dos dados. Esses temas são muito cobrados em concursos, pois garantem que o profissional compreenda tanto a teoria como as práticas recomendadas na área de banco de dados.

2. Resumo teórico

A Mineração de Dados não é exclusiva de uma área – ela é multidisciplinar, utilizada por estatísticos, administradores, engenheiros, entre outros. Suas tarefas principais dividem-se em descritivas (descobrir padrões, sumarizar dados) e preditivas (realizar previsões a partir dos dados). O tratamento dos dados, que inclui a remoção de outliers (valores extremos), é fundamental para garantir modelos mais precisos e robustos, como ressaltam obras acadêmicas (ex: Han, Kamber & Pei; Castro e Ferrari, 2016).

3. Justificativa da alternativa correta

Todas as sentenças são falsas:

I – Incorreta: Mineração de Dados é multidisciplinar, não exclusiva da engenharia da computação.

II – Incorreta: Tarefas descritivas não fazem predição. Elas descrevem padrões; quem faz predição são as tarefas preditivas.

III – Incorreta: Outliers podem e muitas vezes devem ser removidos para melhorar a qualidade do modelo.

Portanto, E é a correta.

4. Análise das alternativas incorretas

A, B, C e D são incorretas porque todas se baseiam em sentenças incorretas (veja explicações acima). Sempre que houver dúvida, lembre-se de retornar ao conceito teórico: mineração de dados é ampla, as tarefas descritivas e preditivas são diferentes e o tratamento de outliers é recomendado.

5. Estratégias de interpretação

Fique atento a palavras como "exclusiva", "não podem", "possuem o objetivo", pois costumam ser absolutas e indicar pegadinhas. Leia cada sentença com calma, compare com a teoria e, se necessário, descarte alternativas por eliminação.

Gostou do comentário? Deixe sua avaliação aqui embaixo!

Clique para visualizar este gabarito

Visualize o gabarito desta questão clicando no botão abaixo

Comentários

Veja os comentários dos nossos alunos

I – A mineração de dados é uma disciplina exclusiva da engenharia da computação, utilizada como ferramenta por demais áreas de conhecimento. (FALSO. Na minha visão, a mineração de dados é uma área multidisciplinar)

II – As tarefas descritivas da mineração de dados fazem inferência a partir dos dados e possuem o objetivo de realizar predições. (FALSO. São as tarefas preditivas que fazem inferências.)

III – Durante as tarefas de mineração de dados, os valores de dados outliers não podem ser descartados, para garantir a fidedignidade do modelo em uso. (FALSO. Os dados outliers podem sim ser descartados, a depender do propósito da análise. Se, por exemplo, estivermos analisando dados de fraude de cartão de crédito, ai sim, os outliers são os nossos objetos alvo, portanto, não devem ser excluídos. Mas na maioria dos casos, os outliers só atrapalham e geram ruídos, então não só podem, como devem ser excluídos.)

[GABARITO: LETRA E]

I – A mineração de dados é uma disciplina exclusiva da engenharia da computação, utilizada como ferramenta por demais áreas de conhecimento.

  • Falsa. A mineração de dados é uma área interdisciplinar que se baseia em fundamentos da Matemática/Estatística, Inteligência Artificial/Aprendizado de Máquina e Sistemas de Banco de Dados/Ciência da Computação. Embora seja ensinada e desenvolvida em cursos de Engenharia e Ciência da Computação, ela não é "exclusiva" de uma única disciplina e é, na verdade, uma área fundamental da Ciência de Dados, sendo aplicada por diversas áreas de conhecimento.

II – As tarefas descritivas da mineração de dados fazem inferência a partir dos dados e possuem o objetivo de realizar predições.

  • Falsa. As tarefas de mineração de dados são geralmente divididas em:
  • Descritivas: Têm o objetivo de descrever e summarizar os dados, encontrando padrões e tendências compreensíveis (Ex: Agrupamento/Clusterização e Regras de Associação). Elas focam no que aconteceu nos dados.
  • Preditivas: Têm o objetivo de realizar inferência (generalização) a partir dos dados para realizar predições sobre valores futuros ou desconhecidos (Ex: Classificação e Regressão). Elas focam no que pode acontecer.
  • A sentença mistura os conceitos: as tarefas descritivas não possuem o objetivo de realizar predições; esse é o objetivo das tarefas preditivas.

III – Durante as tarefas de mineração de dados, os valores de dados outliers não podem ser descartados, para garantir a fidedignidade do modelo em uso.

  • Falsa. O tratamento de outliers (valores atípicos) é uma etapa crucial no pré-processamento dos dados. O que fazer com um outlier depende do contexto:
  • Se o outlier for resultado de um erro de medição ou registro, ele deve ser corrigido ou descartado para evitar que vicie o modelo.
  • Se o objetivo da mineração for a detecção de anomalias/outliers (como em casos de fraude), eles não devem ser descartados, pois são o próprio conhecimento procurado.
  • No entanto, a afirmação de que não podem ser descartados para "garantir a fidedignidade do modelo" é incorreta, pois, muitas vezes, descartar ou tratar outliers causados por erros é exatamente o que se faz para melhorar a fidedignidade e a acurácia de um modelo de classificação ou regressão.

Conclusão:

Todas as sentenças apresentadas são falsas.

FONTE: GEMINI.

Clique para visualizar este comentário

Visualize os comentários desta questão clicando no botão abaixo