Um arquiteto de dados está projetando o Data Warehouse (DW) ...

Próximas questões
Com base no mesmo assunto
Q3874738 Banco de Dados
Um arquiteto de dados está projetando o Data Warehouse (DW) de uma grande rede de varejo. A tabela de fatos de vendas (Fato_Vendas) deverá ser conectada a uma dimensão de produtos. A hierarquia dos produtos é complexa e profunda: Departamento Divisão → Categoria → Subcategoria → Produto.
O administrador de banco de dados (DBA), preocupado com a integridade dos dados e o espaço de armazenamento, propôs que essa hierarquia fosse modelada seguindo os princípios da normalização. Segundo a proposta, a tabela de produtos conteria apenas o ID da subcategoria, que apontaria para uma tabela de subcategorias, que, por sua vez, apontaria para uma tabela de categorias, e assim sucessivamente, evitando a repetição de textos descritivos (como o nome do departamento) em milhões de linhas de produtos.

Considerando os conceitos de modelagem dimensional (Ralph Kimball) e o impacto dessa decisão na performance de consultas analíticas (OLAP), é correto afirmar que: 
Alternativas

Gabarito comentado

Confira o gabarito comentado por um dos nossos professores

Gabarito: A

Fundamento decisivo: A decisão estava em reconhecer que a hierarquia de produtos foi dividida em tabelas relacionadas por nível, o que caracteriza snowflake schema e diferencia a proposta do esquema estrela.

Tema central: Star vs Snowflake
Análise das alternativas
A
Certa
A alternativa A está correta porque a proposta normaliza a dimensão Produto em níveis hierárquicos separados, caracterizando esquema floco de neve. Esse desenho reduz redundância na dimensão e melhora a manutenção referencial, mas costuma exigir mais junções para recuperar os atributos completos nas consultas OLAP.
B
Errada
Erra a classificação do modelo. O enunciado não descreve esquema estrela, mas sim dimensão normalizada em múltiplas tabelas, que é floco de neve. Além disso, a afirmação de que essa normalização garantiria uso mais eficiente de bitmap indexes não é o critério definidor do modelo nem a conclusão geral adotada na modelagem dimensional de Kimball.
C
Errada
Erra ao transformar em regra geral a ideia de que a desnormalização completa da dimensão deve ser evitada em DW moderno. Isso contraria o princípio dimensional clássico destacado na base, segundo o qual o esquema estrela com dimensão desnormalizada é prática consagrada. Também não procede a afirmação de que a redundância textual, por si, inviabiliza compressão eficiente e impõe aumento de I/O como fundamento para rejeitar estrela.
D
Errada
A proposta pode aproximar a dimensão de uma estrutura mais normalizada, mas a alternativa erra ao dizer que isso inviabiliza o uso de Power BI ou Tableau. A base afirma expressamente que essas ferramentas conseguem consumir modelos normalizados; o problema é de maior complexidade, não de incompatibilidade técnica.
E
Errada
O critério distintivo entre estrela e floco de neve foi definido de forma errada. A diferença central está na normalização ou desnormalização das dimensões, não em normalizar a tabela fato para evitar duplicação de métricas. Também é falsa a oposição segundo a qual snowflake usa chaves naturais e estrela exige surrogate keys, porque ambos os modelos podem usar surrogate keys em dimensões.
Pegadinha da questão
A confusão explorada foi associar normalização da hierarquia da dimensão a uma suposta vantagem analítica ou ao esquema estrela, quando esse desenho caracteriza snowflake e tende a aumentar joins em OLAP.
Dica para questões semelhantes
  • Se a hierarquia de uma dimensão aparece quebrada em tabelas separadas, classifique como snowflake, não como star.
  • Em questão de DW segundo Kimball, desnormalização de dimensão costuma apontar para esquema estrela e melhor simplicidade de consulta.
  • Economia de espaço e integridade referencial na dimensão não bastam para concluir melhor desempenho analítico; verifique o efeito sobre a quantidade de joins.
  • Não use tipo de chave nem compatibilidade com ferramenta de BI como critério para distinguir estrela de floco de neve.

Clique para visualizar este gabarito

Visualize o gabarito desta questão clicando no botão abaixo

Comentários

Veja os comentários dos nossos alunos

Gabarito (A)

Ao mencionar um modelo baseado em hierarquia, tende-se a descartar o esquema estrela, pois este é caracterizado pela desnormalização dos dados. No esquema estrela, a tabela fato se relaciona diretamente com tabelas de dimensão desnormalizadas, o que pode gerar redundância de dados, mas traz como principal vantagem o melhor desempenho em consultas, devido à redução da quantidade de junções (joins). Como desvantagem, há maior consumo de espaço de armazenamento.

Por outro lado, o esquema floco de neve (snowflake) é mais normalizado e pode representar hierarquias dentro das dimensões. Nesse modelo, as tabelas de dimensão são divididas em múltiplas tabelas relacionadas, exigindo mais junções nas consultas. Isso pode impactar negativamente o desempenho, embora reduza a redundância e o uso de armazenamento.

Fontes: https://www.thoughtspot.com/data-trends/data-modeling/star-schema-vs-snowflake-schema

https://databasers.com.br/blog/details/modelagem-estrela-floco-de-neve

Clique para visualizar este comentário

Visualize os comentários desta questão clicando no botão abaixo