Em relação aos repositórios de dados data lake e data wareho...

Próximas questões
Com base no mesmo assunto
Q3952847 Banco de Dados
Em relação aos repositórios de dados data lake e data warehouse em arquiteturas de Big Data, analise as afirmativas a seguir.

I. Um data lake é caracterizado por priorizar a ingestão de dados em seu formato original, permitindo armazenar dados estruturados, semiestruturados e não estruturados, com uso de abordagens de schema-on-read.
II. Um data warehouse adota schema-on-write, exigindo modelagem prévia, como esquemas em estrela ou floco de neve, para suportar consultas analíticas otimizadas.
III. A simples adoção de schema-on-write em um data lake o caracteriza automaticamente como um data warehouse.

É verdadeiro o que se afirma em
Alternativas

Gabarito comentado

Confira o gabarito comentado por um dos nossos professores

Gabarito: A

O que precisava saber: Era necessário distinguir que o data lake prioriza a ingestão de dados em formato original, inclusive estruturados, semiestruturados e não estruturados, com schema-on-read, enquanto o data warehouse é orientado à análise, com dados previamente tratados, integrados e modelados sob schema-on-write, frequentemente com modelagem dimensional como estrela ou floco de neve. Também era preciso saber que o uso isolado de schema-on-write não basta para caracterizar automaticamente um repositório como data warehouse.

Critério decisivo: A assertiva I está correta porque descreve o data lake como repositório que armazena dados em formato bruto e usa schema-on-read; a assertiva II está correta porque o data warehouse exige modelagem prévia e opera com schema-on-write; a assertiva III está incorreta porque a mera adoção de schema-on-write não transforma automaticamente um data lake em data warehouse, pois a caracterização depende também de finalidade, organização e modelagem analítica do repositório.

Tema central: Diferenças conceituais entre data lake e data warehouse em arquitetura de Big Data, especialmente quanto ao momento de modelagem dos dados e ao uso de schema-on-read e schema-on-write.
Análise das alternativas
A
Certa
A alternativa A está correta porque reúne exatamente as assertivas I e II, que correspondem às definições centrais da base. A I coincide com a caracterização do data lake como repositório voltado ao armazenamento de dados em formato original, com suporte a dados estruturados, semiestruturados e não estruturados, aplicando a estrutura no momento da leitura, isto é, schema-on-read. A II coincide com a definição de data warehouse como repositório orientado à análise, com dados previamente tratados, integrados e modelados, em schema-on-write, frequentemente com esquemas em estrela ou floco de neve. Como a III é falsa, a combinação correta é I e II, apenas.
B
Errada
Incorreta. Embora a assertiva I esteja correta, a III contraria a base, que afirma que a simples adoção de schema-on-write em um data lake não o caracteriza automaticamente como data warehouse, porque essa classificação depende também de finalidade, organização, curadoria e modelagem analítica.
C
Errada
Incorreta. A alternativa considera apenas a assertiva II, mas a base também confirma a veracidade da assertiva I ao definir o data lake como repositório que recebe dados em formato original e aplica schema-on-read.
D
Errada
Incorreta. A assertiva III é expressamente rejeitada pela base, que estabelece que schema-on-write, isoladamente, não é critério suficiente para transformar um data lake em data warehouse.
E
Errada
Incorreta. A alternativa inclui a assertiva III como verdadeira, mas a base afirma que ela está errada, pois a caracterização de um data warehouse não decorre apenas do uso de schema-on-write.
Pegadinha da questão
A pegadinha está em tratar schema-on-write como critério suficiente para converter automaticamente um data lake em data warehouse. A base deixa claro que essa inferência é indevida, porque a distinção entre os repositórios depende do conjunto de características do ambiente, como finalidade analítica, integração, curadoria e modelagem.
Dica para questões semelhantes
  • Compare sempre o momento em que a estrutura é aplicada: schema-on-read aponta para data lake; schema-on-write aponta para data warehouse.
  • Associe data lake a ingestão ampla de dados em formato original, inclusive estruturados, semiestruturados e não estruturados.
  • Associe data warehouse a dados previamente tratados, integrados e modelados para análise, com esquemas como estrela ou floco de neve.
  • Não conclua que um repositório virou data warehouse apenas por adotar schema-on-write; verifique também finalidade, organização e modelagem analítica.

Clique para visualizar este gabarito

Visualize o gabarito desta questão clicando no botão abaixo