Sobre o processo de ETL (Extract, Transform, Load), assinal...
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Alternativa correta: A
Tema central: O tema da questão é o processo ETL (Extract, Transform, Load), fundamental para bancos de dados e inteligência de negócios. O ETL consiste nas etapas de extração dos dados de diferentes fontes, transformação para padronizar e corrigir informações, e carga no Data Warehouse. Entender corretamente cada fase é essencial para garantir dados de qualidade na tomada de decisões empresariais.
Resumo teórico:
- Extração (Extract): Retira dados de fontes heterogêneas (bancos operacionais, planilhas, etc.), geralmente sem realizar conversão ou padronização profunda nesta etapa.
- Transformação (Transform): Converte, limpa, padroniza e trata os dados, corrigindo inconsistências e adaptando ao formato do Data Warehouse.
- Carga (Load): Insere os dados tratados no Data Warehouse, tornando-os prontos para análise.
Justificativa da alternativa correta (A):
A afirma que na etapa de extração, os dados já são convertidos para um único formato devido à heterogeneidade. Isso é incorreto. Na extração, o objetivo principal é coletar os dados, mas a padronização e conversão ocorrem prioritariamente na etapa de transformação, não na extração. Por isso, a alternativa A está errada e é a resposta correta da questão.
Análise das alternativas incorretas:
B – Correta. De fato, a extração coleta os dados e a transformação os padroniza.
C – Incorreta. O tratamento de inconsistências faz parte da transformação, não da extração. Contudo, essa alternativa está menos errada que A, pois pode haver validações simples.
D – Correta. A etapa de carga exige garantir a persistência dos dados no Data Warehouse.
E – Incorreta. Após a extração, os dados ainda precisam ser transformados antes de serem carregados em seu destino final.
Dica para concursos: Sempre atente para os verbos das etapas e lembre-se: extração = coletar, transformação = tratar, carga = armazenar. Pegadinhas comuns envolvem confundir as funções dessas etapas.
Gostou do comentário? Deixe sua avaliação aqui embaixo!
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
Após a etapa de extração, os dados são colocados em seu local definitivo no Data Warehous? Está correto isso ?
Após a extração, os dados não são tratados ?
Gabarito A.
Em relação a sua pergunta The student, após a extração dos dados, eles são colocados na "Data Staging Área", uma área temporária para armazenamento dos dados.
Desta forma, ao invés de acessar os dados diretamente da fonte, o processo de “transformação” do ETL pega os dados da Staging Area para tratar e entregar os dados.
Luciano Silva mas como você mesmo disse a Data Staging Área é um local temporário e a letra E fala em seu local definitivo, acho que seria passiva de anulação.
A alternativa C também não estaria errada?
No livro Data WareHouse Toolkit de Kimball diz: "Once the data is extracted to the staging area, there are numerous potential transformations, such as cleansing the data (correcting misspellings, resolving domain conflicts, dealing with missing elements, or parsing into standard formats), combining data from multiple sources, deduplicating data, and assigning warehouse keys. These transformations are all precursors to loading the data into the data warehouse presentation area." (Cap. 1, pag. 8)
Ou seja, o tratamento de inconsistência não é feita na Extração mas na Transformação. Correto?
Sem condição. Letra A é a única correta.
.
A) Correto, a extração faz a conversão para um determinado formato [1]
B) Errado, a conversão é feita já na extração [1]. A transformação realiza operações como seleção de colunas, junção de dados, cálculos, renomeações, limpeza, etc.
C) Errado, tratamento de inconsistência é na Transformação [2]
D) Errado, os dados transformados ficam no Staging Area [3]
E) Errado, após extração, fica no Staging Area [3]
.
[1] "In general, the extraction phase aims to convert the data into a single format appropriate for transformation processing" <https://en.wikipedia.org/wiki/Extract,_transform,_load>
[2] "O processo de transformação dos dados deve atender a alguns critérios como limpeza, padronização e qualidade. Aqui é hora de corrigir inconsistências e imprecisões com o objetivo de consolidar a informação obtida." <https://www.mjvinnovation.com/pt-br/blog/o-que-e-etl-como-funciona/>
[3] <https://cdn.holistics.io/guidebook/analytics-setup/etl-process.png>
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo