Em relação aos repositórios de dados data lake e data wareho...
I. Um data lake é caracterizado por priorizar a ingestão de dados em seu formato original, permitindo armazenar dados estruturados, semiestruturados e não estruturados, com uso de abordagens de schema-on-read.
II. Um data warehouse adota schema-on-write, exigindo modelagem prévia, como esquemas em estrela ou floco de neve, para suportar consultas analíticas otimizadas.
III. A simples adoção de schema-on-write em um data lake o caracteriza automaticamente como um data warehouse.
É verdadeiro o que se afirma em
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Gabarito: A
O que precisava saber: Era necessário distinguir que o data lake prioriza a ingestão de dados em formato original, inclusive estruturados, semiestruturados e não estruturados, com schema-on-read, enquanto o data warehouse é orientado à análise, com dados previamente tratados, integrados e modelados sob schema-on-write, frequentemente com modelagem dimensional como estrela ou floco de neve. Também era preciso saber que o uso isolado de schema-on-write não basta para caracterizar automaticamente um repositório como data warehouse.
Critério decisivo: A assertiva I está correta porque descreve o data lake como repositório que armazena dados em formato bruto e usa schema-on-read; a assertiva II está correta porque o data warehouse exige modelagem prévia e opera com schema-on-write; a assertiva III está incorreta porque a mera adoção de schema-on-write não transforma automaticamente um data lake em data warehouse, pois a caracterização depende também de finalidade, organização e modelagem analítica do repositório.
- Compare sempre o momento em que a estrutura é aplicada: schema-on-read aponta para data lake; schema-on-write aponta para data warehouse.
- Associe data lake a ingestão ampla de dados em formato original, inclusive estruturados, semiestruturados e não estruturados.
- Associe data warehouse a dados previamente tratados, integrados e modelados para análise, com esquemas como estrela ou floco de neve.
- Não conclua que um repositório virou data warehouse apenas por adotar schema-on-write; verifique também finalidade, organização e modelagem analítica.
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo