Considere as afirmativas acerca de Mineração de Dados: I – ...

Próximas questões
Com base no mesmo assunto
Q3541848 Banco de Dados
Considere as afirmativas acerca de Mineração de Dados:

I – As soluções para resolver o problema de valores ausentes são diversas, sendo as mais comuns: remoção do exemplar em que ocorre a falta do valor, preenchimento manual dos valores e preenchimento automático dos valores.
II – Os valores ruidosos referem-se a modificações dos valores originais e que, portanto, consistem em erros de medidas ou em valores consideravelmente diferentes da maioria dos outros valores do conjunto de dados, os chamados outliers. Há duas abordagens para o tratamento destes dados: inspeção e correção manual; e identificação e limpeza automática.
III - Procedimentos para integração de dados consistem em realizar ações que permitam integrar, adequadamente, dados provenientes de diversas fontes de dados. Geralmente, quando os dados provêm de diferentes fontes, os valores assumidos por atributos não possuem o mesmo domínio ou não estão formatados sob o mesmo tipo de dado, ainda que digam respeito à mesma descrição de uma entidade do mundo real. As principais motivações para a aplicação de procedimentos de integração de dados são, portanto, a presença de valores inconsistentes e a presença de valores redundantes.

De acordo com Silva, Peres e Boscarioli (2016), é CORRETO afirmar que: 
Alternativas

Gabarito comentado

Confira o gabarito comentado por um dos nossos professores

Gabarito: D - Todas as sentenças são verdadeiras.

Tema central da questão

Esta questão aborda a pré-processamento de dados na Mineração de Dados, um tema vital para quem pretende trabalhar com dados de qualidade e extrair conhecimento relevante a partir deles. Os tópicos cobrados envolvem tratamento de valores ausentes, valores ruidosos/outliers e integração de dados. Esses conceitos estão amplamente descritos em livros como Han, Kamber & Pei (“Data Mining: Concepts and Techniques”) e na obra de Silva, Peres e Boscarioli (2016), citada na questão.

Resumo teórico

Valores ausentes: São registros incompletos no conjunto de dados. As principais soluções são remover o registro, preencher os valores manualmente ou automaticamente (por média, moda, interpolação, etc).

Valores ruidosos (outliers): São dados que se desviam muito do padrão dos demais. Podem indicar erros ou fenômenos interessantes. O tratamento pode ser manual ou por métodos automáticos, como suavização ou remoção.

Integração de dados: É o processo de unificação de dados provenientes de diferentes fontes, lidando com inconsistências de formatos, domínios e redundâncias.

Justificativa da alternativa correta

Todas as sentenças (I, II e III) são verdadeiras. Cada uma descreve corretamente estratégias e conceitos amplamente aceitos no pré-processamento de dados para mineração:

  • I: Apresenta as soluções tradicionais para valores ausentes.
  • II: Define corretamente o que são valores ruidosos/outliers e suas formas de tratamento.
  • III: Explica o objetivo da integração de dados e os problemas enfrentados nesse processo.

Análise das alternativas incorretas

  • A: Apenas a sentença I é verdadeira? Incorreto. As sentenças II e III também estão corretas.
  • B: Apenas I e II? Incorreto. A sentença III também está correta.
  • C: Apenas II e III? Incorreto. A sentença I também está correta.
  • E: Todas são falsas? Incorreto. Todas são verdadeiras.

Estratégias de interpretação

Questões assim exigem leitura atenta de cada sentença e comparação com a teoria. Fique atento a generalizações, omissões ou inversões sutis! Aqui, como todas as afirmativas estão corretas, não há pegadinha, mas sempre analise cada uma de modo independente.

Gostou do comentário? Deixe sua avaliação aqui embaixo!

Clique para visualizar este gabarito

Visualize o gabarito desta questão clicando no botão abaixo