Questões de Concurso
Sobre etl (extract transform load) em banco de dados
Foram encontradas 211 questões
Baseando-se nessas informações, pode-se concluir que a etapa do KDD responsável pela limpeza, seleção e transformação dos dados antes da aplicação dos algoritmos é denominada:
I.Eliminação - Durante essa etapa, o ETL identifica os dados duplicados e os remove de suas origens, de forma que possa transportar somente os dados limpos para o destino. Os dados podem vir de fontes estruturadas e não estruturadas, incluindo documentos, e-mails, aplicações de negócios, bancos de dados, equipamentos, sensores, terceiros e muito mais.
II.Transformação - Como os dados extraídos são brutos em sua forma original, eles precisam ser mapeados e transformados para prepará-los para o armazenamento de dados eventual. No processo de transformação, o ETL valida, autentica, deduplica e/ou agrega os dados de formas que tornam os dados resultantes confiáveis e consultáveis.
III.Limpeza - Durante essa etapa, o ETL limpa os dados transformados para o armazenamento otimizado no destino. Esta etapa pode implicar o carregamento inicial de todos os dados de origem ou pode ser o carregamento de alterações incrementais nos dados de origem.
É CORRETO o que se afirma em:
Em um projeto de BI (Business Intelligence), dados de vendas são coletados de várias filiais que usam sistemas diferentes. Os dados de “Unidade Federativa” chegaram em formatos inconsistentes (ex: “SP”, “São Paulo”, “S. Paulo”, “sp”). Para que os relatórios sejam precisos, esses valores precisam ser padronizados para um único formato (ex: “SP”).
Com base nessa situação hipotética e no contexto de um pipeline de ETL, assinale a opção que apresenta a fase em que essa operação de limpeza e padronização de dados deve ocorrer.
Assinale a opção que apresenta a principal responsabilidade e o desafio da fase Load no processo ETL, especialmente em relação ao design de índice e particionamento da Tabela de Fato.
No contexto do DataOps, assinale a opção que apresenta a combinação de práticas e ferramentas que garante a rastreabilidade de
I. código de transformação (SQL/ETL);
II. alterações no schema do DW; e
III. rollback, coordenação automatizada, em caso de falha de deployment.
I. Esquema em estrela organiza fatos centrais e dimensões desnormalizadas, favorecendo agregações e varreduras.
II. Slowly Changing Dimension tipo 2 preserva histórico por linhas adicionais com controle de vigência.
III. Carga incremental por ETL registra apenas diferenças, reduzindo janelas e riscos na integração.
IV. Grão do fato precisa de definição explícita, orientando granularidade de medidas e chaves.
V. Dimensão tipo 1 substitui valores históricos por colunas de auditoria e data de validade.
Estão corretas as afirmativas:
Julgue o próximo item, relativo a data warehouse, ETL e OLAP.
A técnica de junção do ETL consiste em aplicar regras de negócio aos dados para a obtenção de novos valores com base em valores já existentes.
Em relação ao Processo ETL no contexto de DW, avalie as seguintes afirmações:
I. O tratamento de valores nulos, a padronização de campos e a detecção de dados duplicados são atividades típicas da fase de Extract (Extração).
II. Em um processo de ETL, os dados são geralmente carregados no Data Warehouse em tempo real para garantir a máxima atualidade das informações.
III. A fase de Load (Carregar) é responsável por inserir os dados na base de dados do DW. IV. O processo ETL envolve extrair dados de diversas origens, transforma-los para atender as necessidades da análise e, finalmente, carregá-los no destino.
Assinale a alternativa que apresenta APENAS as afirmações corretas.
Em relação ao processo de ETL, assinale a afirmativa correta.
Assinale a alternativa que representa uma operação típica de transformação de dados no contexto de ETL (Extract, Transform, Load).
Sobre as etapas do processo de ETL (Extract, Transform, Load), informe se é verdadeiro (V) ou falso (F) o que se afirma a seguir e assinale a alternativa com a sequência correta.
( ) A etapa de extract envolve a captura de dados de diversas fontes, como bancos de dados, arquivos CSV (Comma-Separated Values), APIs (Application Programming Interfaces), entre outros.
( ) A etapa de transform envolve a inserção ou atualização dos dados em um destino, como um banco de dados, data warehouse ou data lake.
( ) A etapa de load envolve limpeza, formatação, agregação, conversão ou enriquecimento dos dados.