O profiling de dados é uma etapa analítica realizada sobre ...

Próximas questões
Com base no mesmo assunto
Q4036241 Banco de Dados
O profiling de dados é uma etapa analítica realizada sobre conjuntos de dados com o objetivo de compreender sua estrutura, qualidade e distribuição antes de iniciar processos de transformação ou carga em camadas analíticas. A realização adequada do profiling permite identificar problemas de qualidade e orientar as regras de tratamento a serem aplicadas no pipeline. Diante disso, analise as afirmativas a seguir sobre profiling básico de dados:
I. A análise de cardinalidade em uma coluna consiste em identificar o número de valores distintos presentes, sendo útil para reconhecer possíveis chaves candidatas e detectar colunas com baixa variabilidade que podem indicar problemas de qualidade.
II. O profiling de nulidade verifica a proporção de valores ausentes em cada coluna, fornecendo informações relevantes para decisões sobre estratégias de tratamento, como imputação, exclusão de registros ou criação de indicadores de ausência.
III. A análise de distribuição de frequência permite identificar quais valores ocorrem com maior regularidade em uma coluna e é aplicável exclusivamente a colunas com tipos de dados numéricos, não sendo útil para colunas do tipo texto ou categórico.
IV. O profiling básico, por ser uma análise estática realizada antes da ingestão, elimina a necessidade de validações de qualidade posteriores durante as fases de transformação e carga, desde que o dataset analisado não sofra alterações estruturais.
Estão CORRETAS: 
Alternativas

Comentários

Veja os comentários dos nossos alunos

A alternativa correta é a B) I e II, apenas.

Clique para visualizar este comentário

Visualize os comentários desta questão clicando no botão abaixo