Questões de Concurso
Sobre etl (extract transform load) em banco de dados
Foram encontradas 211 questões
Um analista de dados de uma agência reguladora está desenvolvendo um painel para monitorar indicadores de desempenho do setor. Ele está utilizando uma ferramenta de BI que envolve um processo de ETL (Extração, Transformação e Carga) para preparar os dados.
Analise as seguintes proposições sobre as etapas do processo de BI:
I. Extração (Extract): É a fase de coleta de dados de diversas fontes, que podem ser bancos de dados relacionais (SQL Server, Oracle), planilhas (Excel), arquivos de texto (CSV), serviços web (APIs), entre outros.
II. Transformação (Transform): Nesta fase, os dados extraídos são limpos, padronizados, combinados e modelados. Podem ser realizadas operações como remoção de duplicatas, cálculo de novas colunas e criação de hierarquias para preparar os dados para a análise.
III. Carga (Load): Após a transformação, os dados são carregados no modelo de dados da ferramenta de BI (como o Power BI ou Qlik Sense), onde ficarão disponíveis para a criação de relatórios e dashboards interativos.
Está correto o que se afirma em:
I. A análise de cardinalidade em uma coluna consiste em identificar o número de valores distintos presentes, sendo útil para reconhecer possíveis chaves candidatas e detectar colunas com baixa variabilidade que podem indicar problemas de qualidade.
II. O profiling de nulidade verifica a proporção de valores ausentes em cada coluna, fornecendo informações relevantes para decisões sobre estratégias de tratamento, como imputação, exclusão de registros ou criação de indicadores de ausência.
III. A análise de distribuição de frequência permite identificar quais valores ocorrem com maior regularidade em uma coluna e é aplicável exclusivamente a colunas com tipos de dados numéricos, não sendo útil para colunas do tipo texto ou categórico.
IV. O profiling básico, por ser uma análise estática realizada antes da ingestão, elimina a necessidade de validações de qualidade posteriores durante as fases de transformação e carga, desde que o dataset analisado não sofra alterações estruturais.
Estão CORRETAS:
O formato CSV é amplamente utilizado em pipelines de dados para transferência de conjuntos de dados entre sistemas heterogêneos. Apesar de sua simplicidade, o formato apresenta características e limitações técnicas que devem ser consideradas durante a implementação de processos de ingestão e integração. Diante disso, analise as afirmativas a seguir sobre o formato CSV:
II. Um arquivo CSV suporta a representação nativa de dados hierárquicos e aninhados, como listas de itens vinculados a um único registro pai, desde que os delimitadores aninhados sejam configurados corretamente no parser utilizado.
III. Quando um valor de campo contém o caractere delimitador, esse campo deve ser envolvido entre aspas duplas para que o parser o interprete como um único valor, conforme previsto pela especificação RFC 4180.
IV. A codificação de caracteres utilizada em um arquivo CSV é declarada de forma explícita no próprio arquivo, garantindo que sistemas distintos realizem a leitura correta dos dados sem necessidade de configuração adicional.
Está(ão) CORRETA(S):
No contexto de Business Intelligence (BI), o desenvolvimento de Datamarts e a execução de processos de ETL (Extract, Transform, Load) são fundamentais para organizar, integrar e disponibilizar informações de forma eficiente para análise gerencial. Com base nesses conceitos, analise as assertivas a seguir sobre Datamarts e ETL e julgue-as em Verdadeiras (V) ou Falsas (F):
( ) Uma estrutura de Datamarts é do tipo Snowflake Schema, na qual a estrutura de dimensões é desnormalizada (tudo em uma tabela).
( ) No ETL, especificamente na etapa de Load, um dos tipos de carregamento é full load, em que todos os dados existentes são substituídos pelo novo conjunto.
( ) No ETL, especificamente na etapa de Transform, uma atividade pode ser de derivação, por exemplo, criar campos novos a partir de existentes (ex.: lucro = receita - custo).
Qual alternativa preenche, CORRETAMENTE, de cima para baixo, os parênteses acima?
Dentro do fluxo de trabalho de Ciência de Dados, o conjunto de operações que envolve o tratamento de dados faltantes (null/missing values), a normalização de formatos, a remoção de registros redundantes e a correção de erros de digitação ou inconsistências lógicas é tecnicamente denominado
I. A abordagem ELT é recomendada para tarefas relacionadas a LGPD porque realiza a limpeza de dados sensíveis antes que eles atinjam o sistema de destino, reduzindo riscos de segurança e economizando espaço de armazenamento.
II. No processo ETL, o conjunto de dados completo e sem tratamento é carregado diretamente no sistema de destino. Como há apenas uma etapa, e ela ocorre apenas uma vez, o carregamento no processo ETL é mais rápido do que no ELT.
III. Na abordagem ELT, é possível aproveitar o poder de processamento distribuído e a escalabilidade elástica do data warehouse de destino para realizar transformações via SQL, eliminando a necessidade de um servidor de processamento intermediário.
É verdadeiro o que é afirmado em
O processo de ETL (Extract, Transform, Load) é fundamental para a construção de Data Warehouses.
Qual etapa do processo de ETL é responsável por converter os dados extraídos para um formato consistente e adequado para análise?
No que se refere aos processos de ETL (extract, transform, load) e a técnicas de pré-processamento de dados para classificação e visualização de dados, julgue o próximo item.
Em um gráfico de dispersão, se os valores do eixo vertical diminuírem à medida que os valores do eixo horizontal aumentarem, a direção será considerada positiva.
No que se refere aos processos de ETL (extract, transform, load) e a técnicas de pré-processamento de dados para classificação e visualização de dados, julgue o próximo item.
Em ETL, a transformação de uma linha que contém colunas com múltiplas ocorrências em uma linha para cada instância dos dados com múltiplas ocorrências é um exemplo de normalização de dados da etapa transform.
No que diz respeito a Big Data, ETL/ELT e metadados, julgue o próximo item.
Uma das técnicas utilizadas na etapa de transformação do processo de ETL é a derivação, em que são vinculados dados semelhantes oriundos de diferentes fontes de dados.
Assinale a opção que descreve uma operação tipicamente executada na fase de Transformação.