ETL é o método mais comum para transferir dados de uma font...
Staging tables:
Cria um ambiente intermediário de armazenamento e processamento dos dados oriundos de aplicações OLTP e outras fontes padrão ETL.
Representa um armazenamento intermediário dos dados, facilitando a integração dos dados do ambiente operativo da sua atualização no DW.
Pode servir de base par a análises do ambiente operativo, pois sua granulidade é normalmente compatível com sistemas desse ambiente
É investigada para verificar a determinação de onde ocorreram erros
Limpa dados sujos que entram no processo de extração
Fonte: Tecnologia e Projeto de Data Warehouse - Machado
ETL x ELT
Ambos são métodos de transferência de dados, de diversas fontes, para uma data warehouse, para posterior visualização e entrega de informações. Contudo, há diferenças significativas no que diz respeito a performance, desempenho e economia.
O método ETL é o mais comum, a sigla vem do inglês “Extract, Transform, and Load”. Trata-se do processo de extrair dados de diferentes fontes, transformá-los no formato desejado e entregando estes dados no banco de dados target. O método ELT (Extract Load and Transform) é semelhante, porém, há uma inversão na ordem dos processos.
No método ETL, o dado é extraído de diferentes fontes, processado separadamente e descarregado em uma data warehouse.
Ver imagem na fonte.
Já no método ELT, os dados são extraídos e carregados diretamente em um único repositório, onde a transformação do formato original do dado para o formato target.
Ver imagem na fonte.
Fonte: http://www.targettrust.com.br/blog/mercado-de-ti/oracle-odi-processos-e-lt-e-seus-beneficios/
Gabarito: a)
A) Na abordagem ELT, os dados são primeiro carregados no data warehouse e, em seguida, são transformados e processados conforme necessário dentro do próprio data warehouse. Para isso, são utilizadas tabelas intermediárias, também conhecidas como staging tables, para armazenar temporariamente os dados brutos antes que sejam transformados e carregados nas tabelas finais do data warehouse.
B) - A utilização de tecnologias distintas de banco de dados de origem e destino não é uma característica específica do processo ELT. Tanto no processo ETL quanto no ELT, podem ser usadas tecnologias diferentes para os bancos de dados de origem e destino, dependendo das necessidades e requisitos do projeto.
C) - A escolha da metodologia de modelagem de dados, como a Metodologia Kimball e os esquemas estrela normalizados, não está diretamente relacionada à decisão de usar ETL ou ELT. Essas metodologias de modelagem de dados são independentes do método de transferência de dados.
D) - A extração completa de todos os dados das tabelas de dimensões e de fatos não é uma característica exclusiva do processo ELT. Tanto no processo ETL quanto no ELT, a extração pode ser completa (extraindo todos os dados) ou incremental (extraindo apenas os dados que foram alterados ou adicionados desde a última extração), dependendo dos requisitos do projeto.
E) - O uso de técnicas de data mining sobre data marts relacionais não é uma característica específica do processo ELT. Data mining pode ser aplicado em data marts independentemente do método de transferência de dados utilizado.
Alternativa correta: A - Staging tables ou tabelas intermediárias no banco de dados de destino (data warehouse).
No que tange à alternativa correta, é fundamental compreender as diferenças entre os métodos de processamento ETL (Extract, Transform, Load) e ELT (Extract, Load, Transform). Enquanto o ETL enfatiza a transformação de dados antes de carregá-los no warehouse, o ELT inverte essa ordem, optando pela transformação após o carregamento dos dados no destino final.
A utilização de staging tables permite que os dados sejam carregados cruamente e armazenados temporariamente no data warehouse antes de serem transformados. Essa abordagem tira proveito da capacidade computacional do sistema de warehouse, que pode ser mais robusta e otimizada para operações intensivas de dados. Assim, a transformação ocorre dentro do próprio data warehouse, o que pode ser mais eficiente e flexível, dependendo do volume de dados e da complexidade das transformações necessárias.
Por outro lado, suas alternativas restantes são incorretas porque não se relacionam diretamente com a necessidade primária do processo ELT:
- B - Tecnologias distintas para origem e destino são uma realidade tanto no ETL quanto no ELT, mas não é um requisito para a implementação de ELT.
- C - A metodologia Kimball e esquemas estrela são conceitos de modelagem e não requisitos de transformação na abordagem ELT.
- D - A extração Full é uma técnica de extração de dados, mas não é específica ou necessária para o modelo ELT por si só.
- E - Técnicas de data mining são procedimentos analíticos aplicados em data marts ou warehouses, não sendo uma exigência para o processo de ELT.
Assim, para que a alternativa A seja implementada com sucesso, o data warehouse deve possuir a capacidade técnica de gerenciar as operações de transformação de dados em grande escala, o que justifica a importância de staging tables para o processamento ELT.