Um arquiteto de dados está projetando o Data Warehouse (DW) ...
O administrador de banco de dados (DBA), preocupado com a integridade dos dados e o espaço de armazenamento, propôs que essa hierarquia fosse modelada seguindo os princípios da normalização. Segundo a proposta, a tabela de produtos conteria apenas o ID da subcategoria, que apontaria para uma tabela de subcategorias, que, por sua vez, apontaria para uma tabela de categorias, e assim sucessivamente, evitando a repetição de textos descritivos (como o nome do departamento) em milhões de linhas de produtos.
Considerando os conceitos de modelagem dimensional (Ralph Kimball) e o impacto dessa decisão na performance de consultas analíticas (OLAP), é correto afirmar que:
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Gabarito: A
Fundamento decisivo: A hierarquia de produtos foi organizada em tabelas separadas e encadeadas, o que caracteriza dimensão normalizada em floco de neve, e não uma única dimensão desnormalizada de esquema estrela.
- Se a hierarquia dimensional está espalhada em tabelas relacionadas, pense em snowflake; se está concentrada em uma única dimensão, pense em star schema.
- Em questões de OLAP, diferencie benefício de manutenção/integridade de benefício de desempenho: normalizar pode ajudar no primeiro e piorar o segundo por aumentar joins.
- Não trate ferramenta de BI como critério de compatibilidade com modelo estrela ou normalizado; a distinção técnica da questão está no desenho das dimensões.
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
A alternativa correta é a A.
Entendimento do cenário:
O DBA propôs:
- Quebrar a dimensão de produto em várias tabelas:
- Produto → Subcategoria → Categoria → Divisão → Departamento
- Isso é normalização da dimensão
Esse modelo é conhecido como Snowflake Schema (floco de neve)
Por que a alternativa A está correta?
Ela descreve exatamente o trade-off clássico:
✔️ Vantagens do Snowflake:
- Menor redundância de dados
- Economia de espaço
- Melhor integridade referencial
❌ Desvantagens:
- Mais joins
- Consultas analíticas mais lentas
E isso impacta diretamente BI / OLAP, que precisa de leitura rápida.
❌ Por que as outras estão erradas?
- B: Errada
- Star Schema = desnormalizado, não normalizado
- A afirmação está invertida
- C: Errada
- DW moderno (colunar) lida bem com redundância
- Star Schema continua sendo altamente recomendado
- D: Errada
- Power BI / Tableau funcionam perfeitamente com modelos normalizados
- E: Errada
- Fato não é normalizado dessa forma
- E Snowflake não depende de chave natural vs surrogate
Fonte: CHATGPT
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo