Questões de Concurso
Sobre dw - data warehouse em banco de dados
Foram encontradas 786 questões
A respeito da arquitetura de DW (data warehouse) e do processo ETL (Extract, Transformation and Load), julgue o item a seguir.
No processo ETL, a etapa de transformação é responsável por aplicar as regras de adequação, convertendo os dados ao formato requerido pelo DW, garantindo sua consistência e usabilidade.
Com base nesse cenário, analise as seguintes afirmações sobre Data Warehouse e Data Lake:
I.Um Data Warehouse seria a solução ideal para armazenar e analisar esses dados, pois ele é otimizado para armazenar dados estruturados em tabelas, como dados de vendas e cadastro de clientes.
II.Um Data Lake seria mais adequado para esse caso, pois permite armazenar dados de diferentes fontes e formatos, como dados estruturados, semiestruturados e não estruturados.
III.No Data Lake, os dados são armazenados em seu formato original, sem necessidade de serem transformados antes de serem armazenados. A transformação dos dados ocorre apenas quando necessário, durante a análise.
IV.O Data Warehouse é mais indicado para análises em tempo real, enquanto o Data Lake é mais adequado para análises complexas que exigem processamento de grandes volumes de dados.
Quais afirmações estão corretas?
I – As aplicações de OLAP são dominadas por consultas ad hoc complexas. Em termos de SQL (Structured Query Language), as consultas OLAP envolvem operadores de agrupamento e agregação e fornecem excelente suporte para condições booleanas complexas.
II – O problema fundamental na manutenção de um Data Warehouse é a manutenção síncrona de tabelas replicadas e visões materializadas.
III – A mineração de dados está relacionada à subárea da estatística chamada análise combinatória de dados.
RAGHU, R.; GEHRKE, J., Sistemas de Gerenciamento de Banco de Dados, 3° Ed. Editora McGraw-Hill, 2011.
Assinale a alternativa correta conforme Raghu e Gehrke (2011):
Observe a figura a seguir.

O esquema de modelagem multidimensional usado é do tipo
Com relação ao DW e MD, avalie se as afirmativas a seguir são verdadeiras (V) ou falsas (F).
( ) O objetivo do DW é dar suporte ao processo de tomada de decisão com dados por intermédio de diversos tipos de algoritmos tais como regras de associação, árvores de classificação. A MD pode ser usado juntamente com o DW para com certos tipos de tomada de decisão em cenários de aplicações de Big Data.
( ) Para tornar o DM mais eficiente o DW dever ter uma coleção de dados agregada e resumida. A MD ajuda na extração de novos padrões que não podem ser encontrados apenas ao consultar e processar dados e metadados do DW.
( ) As aplicações de MD devem ser projetadas para facilitar seu uso juntamente com o DW. Para bancos de dados muito grandes (da ordem de grandeza de terabytes até petabytes de dados), o uso bem-sucedido das aplicações de MD dependerá, em primeiro lugar da construção de um DW.
As afirmativas são, respectivamente,
Coluna A: Técnica de Modelagem e Otimização.
1.Modelo Estrela (Star Schema). 2.Tabelas Fato e Dimensão. 3.Indexação Bitmap. 4.Modelo Snowflake (Floco de Neve). 5.Materialização de Visões.
Coluna B: Descrição
(__)Técnica de otimização que armazena pré-calculados os resultados de consultas frequentes, reduzindo o tempo de resposta nas consultas complexas.
(__)Técnica de indexação usada para bases de dados com alta cardinalidade, facilitando consultas por meio de índices binários.
(__)Estrutura de modelagem que simplifica a análise, mantendo todas as dimensões ligadas diretamente à tabela fato, otimizando a performance de consulta.
(__)Tabelas usadas para armazenar dados detalhados e sumarizados, com a tabela fato contendo medidas e as dimensões contendo atributos.
(__)Modelo de dados que normaliza as tabelas de dimensão, reduzindo redundâncias e aumentando a complexidade das junções.
A sequência correta é:
Quanto aos conceitos de índices, às ferramentas ETL e aos sistemas gerenciadores de banco de dados (SGBDs), julgue o item seguinte.
O índice bitmap, utilizado principalmente em sistemas de Data Warehousing, é mais eficiente em tabelas com baixa cardinalidade (grande quantidade de dados repetidos).
No que diz respeito à normalização das estruturas de dados, à extração de metadados no MySQL, a técnicas de modelagem dimensional e à linguagem de consulta estruturada (SQL – ANSI), julgue o item seguinte.
Na dimensão snowflake, os dados são desnormalizados para evitar joins entre tabelas, o que diminui o tempo de consultas; no entanto, nessa dimensão, devido à repetição de dados, utiliza-se mais espaço em disco.
Ele é como uma ponte entre os sistemas e o Data Warehouse. Nesse contexto, o principal objetivo do processo de ETL em uma solução de Data Warehousing é
Considerando o esquema estrela (star schema), amplamente utilizado nesse contexto, analise as afirmativas a seguir:
I. O esquema estrela é caracterizado por uma tabela de fatos central, que armazena as métricas de negócio, conectada diretamente a várias tabelas de dimensões, que fornecem o contexto para essas métricas.
II. As tabelas de dimensões no esquema estrela são tipicamente normalizadas, garantindo a integridade dos dados e evitando redundâncias.
III. A estrutura do esquema estrela facilita a execução de consultas OLAP (Online Analytical Processing), permitindo a análise multidimensional dos dados sob diferentes perspectivas, como tempo, produto e região.
IV. Uma das vantagens do esquema estrela é a sua simplicidade e facilidade de compreensão, o que contribui para um desenvolvimento mais ágil e uma manutenção mais eficiente do data warehouse.
Está correto o que se afirma em