Um arquiteto de dados está projetando o Data Warehouse (DW)
de uma grande rede de varejo. A tabela de fatos de vendas
(Fato_Vendas) deverá ser conectada a uma dimensão de
produtos. A hierarquia dos produtos é complexa e profunda:
Departamento → Divisão → Categoria → Subcategoria →
Produto.
O administrador de banco de dados (DBA), preocupado com a
integridade dos dados e o espaço de armazenamento, propôs
que essa hierarquia fosse modelada seguindo os princípios da
normalização. Segundo a proposta, a tabela de produtos conteria
apenas o ID da subcategoria, que apontaria para uma tabela de
subcategorias, que, por sua vez, apontaria para uma tabela de
categorias, e assim sucessivamente, evitando a repetição de
textos descritivos (como o nome do departamento) em milhões
de linhas de produtos.
Considerando os conceitos de modelagem dimensional (Ralph
Kimball) e o impacto dessa decisão na performance de consultas
analíticas (OLAP), é correto afirmar que:

Question

Um arquiteto de dados está projetando o Data Warehouse (DW)
de uma grande rede de varejo. A tabela de fatos de vendas
(Fato_Vendas) deverá ser conectada a uma dimensão de
produtos. A hierarquia dos produtos é complexa e profunda:
Departamento → Divisão → Categoria → Subcategoria →
Produto.
O administrador de banco de dados (DBA), preocupado com a
integridade dos dados e o espaço de armazenamento, propôs
que essa hierarquia fosse modelada seguindo os princípios da
normalização. Segundo a proposta, a tabela de produtos conteria
apenas o ID da subcategoria, que apontaria para uma tabela de
subcategorias, que, por sua vez, apontaria para uma tabela de
categorias, e assim sucessivamente, evitando a repetição de
textos descritivos (como o nome do departamento) em milhões
de linhas de produtos.
Considerando os conceitos de modelagem dimensional (Ralph
Kimball) e o impacto dessa decisão na performance de consultas
analíticas (OLAP), é correto afirmar que: Alternativa A: a proposta do DBA configura um esquema floco de neve
(Snowflake Schema); embora economize espaço em disco e
facilite a manutenção da integridade referencial, essa
abordagem prejudica o desempenho das consultas de
Business Intelligence (BI) ao exigir múltiplas junções (joins)
para recuperar a descrição completa dos atributos
hierárquicos; Ou Alternativa B: a abordagem sugerida caracteriza um esquema estrela (Star
Schema), que é o padrão recomendado pela metodologia
Kimball, pois a normalização das dimensões garante que o
motor de banco de dados utilize índices bitmap de forma
mais eficiente, acelerando o filtro de consultas agregadas;  Ou Alternativa C: a desnormalização completa da dimensão, consolidando
todos os níveis hierárquicos em uma única tabela
Dim_Produto (esquema estrela), deve ser evitada em Data
Warehouses modernos baseados em armazenamento
colunar, pois a redundância de dados textuais impede a
compressão eficiente e aumenta o I/O de disco; Ou Alternativa D: a proposta do DBA visa a transformar o modelo dimensional
em um modelo relacional de Terceira Forma Normal (3FN), o
que inviabiliza o uso de ferramentas de visualização de dados
(como Power BI ou Tableau), visto que essas ferramentas são
tecnicamente incompatíveis com tabelas normalizadas; Ou Alternativa E: a tabela fato, tanto no esquema estrela quanto no floco de
neve, deve ser normalizada para evitar a duplicação de
métricas; a diferença reside apenas no fato de que o
esquema floco de neve utiliza chaves naturais (CPF, CNPJ) nas
junções, enquanto o esquema estrela exige o uso de chaves
substitutas (Surrogate Keys).

Qconcursos · Accepted Answer

Alternativa [A] a proposta do DBA configura um esquema floco de neve
(Snowflake Schema); embora economize espaço em disco e
facilite a manutenção da integridade referencial, essa
abordagem prejudica o desempenho das consultas de
Business Intelligence (BI) ao exigir múltiplas junções (joins)
para recuperar a descrição completa dos atributos
hierárquicos; Gabarito: AFundamento decisivo: A hierarquia de produtos foi organizada em tabelas separadas e encadeadas, o que caracteriza dimensão normalizada em floco de neve, e não uma única dimensão desnormalizada de esquema estrela.Tema central: Star vs SnowflakeAnálise das alternativasACertaA alternativa A está correta porque a proposta do DBA normaliza a hierarquia dimensional em tabelas encadeadas, o que caracteriza um esquema floco de neve. Esse desenho reduz redundância e ajuda na integridade referencial, mas tende a exigir mais junções para recuperar a hierarquia completa nas consultas analíticas.BErradaErra na classificação do modelo. A proposta descrita não é esquema estrela, mas floco de neve, porque a dimensão foi normalizada em múltiplas tabelas hierárquicas. Também não há base para sustentar que essa normalização seja o padrão recomendado por Kimball nem que ela garanta uso mais eficiente de bitmap index como fundamento decisivo.CErradaErra ao transformar a desnormalização da dimensão em algo que 'deve ser evitado'. Isso contraria a lógica central da modelagem dimensional, que admite e privilegia dimensões desnormalizadas no esquema estrela. Além disso, a questão não fornece base para afirmar como regra geral que redundância textual em armazenamento colunar impede compressão eficiente ou torna o estrela inadequado.DErradaO problema está na conclusão de incompatibilidade técnica. Mesmo que a proposta aproxime a dimensão de uma estrutura mais normalizada, isso não inviabiliza o uso de ferramentas como Power BI ou Tableau. O máximo que a base permite afirmar é que o modelo pode ficar menos amigável ou menos eficiente para análise, não que as ferramentas sejam tecnicamente incompatíveis.EErradaErra o critério distintivo entre os esquemas. A diferença central entre estrela e floco de neve está na estrutura das dimensões: desnormalizadas no estrela e normalizadas no floco de neve. Não é correto dizer que o floco de neve se define por usar chaves naturais e o estrela por exigir surrogate keys, nem que a tabela fato 'deve ser normalizada' nesses termos para evitar duplicação de métricas.Pegadinha da questãoA confusão real era tomar a normalização da hierarquia da dimensão como se isso ainda fosse esquema estrela, quando esse encadeamento de tabelas caracteriza snowflake.Dica para questões semelhantesSe a hierarquia dimensional está espalhada em tabelas relacionadas, pense em snowflake; se está concentrada em uma única dimensão, pense em star schema.Em questões de OLAP, diferencie benefício de manutenção/integridade de benefício de desempenho: normalizar pode ajudar no primeiro e piorar o segundo por aumentar joins.Não trate ferramenta de BI como critério de compatibilidade com modelo estrela ou normalizado; a distinção técnica da questão está no desenho das dimensões.

🚀 Mais performance?

🚀 Mais performance?

Um arquiteto de dados está projetando o Data Warehouse (DW) ...

Gabarito comentado

Gabarito: A

Clique para visualizar este gabarito

Comentários

Clique para visualizar este comentário

Resumos relacionados

SGBD: Conceitos Fundamentais e Aplicações em Concursos Públicos

Questões de assuntos semelhantes

Provas relacionadas