No processo de descoberta de conhecimento em bases de dados...
Dentro do fluxo de trabalho de Ciência de Dados, o conjunto de operações que envolve o tratamento de dados faltantes (null/missing values), a normalização de formatos, a remoção de registros redundantes e a correção de erros de digitação ou inconsistências lógicas é tecnicamente denominado
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Gabarito: A
O que precisava saber: Era necessário distinguir limpeza de dados das demais etapas do fluxo de trabalho. Limpeza de dados é o processo de tratar problemas de qualidade, como dados faltantes, duplicidades, ruídos, inconsistências, erros de registro e padronização de formatos, para tornar a base adequada à análise.
Critério decisivo: A descrição do enunciado reúne operações de correção e padronização dos dados brutos — tratamento de valores ausentes, normalização de formatos, remoção de redundâncias e correção de erros e inconsistências —, o que caracteriza limpeza de dados (Data Cleaning).
- Se o enunciado destacar valores faltantes, duplicidades, erros de digitação, ruídos e inconsistências, o foco é qualidade de dados, portanto limpeza de dados.
- Diferencie preparação da base de análise da base: limpeza corrige e padroniza dados; mineração busca padrões; EDA explora; integração une fontes; engenharia de atributos cria ou transforma variáveis.
- Quando aparecer normalização de formatos junto com correção de registros e remoção de redundâncias, a chave é identificar saneamento de dados, não modelagem nem descoberta de conhecimento.
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo