Questões de Concurso
Sobre dw - data warehouse em banco de dados
Foram encontradas 786 questões
Assinale a afirmativa que descreve a composição e a função principal da Tabela Fato.
O tipo de índice mais adequado para otimizar a performance de consultas que envolvem essas colunas de baixa cardinalidade em um DW é o
Assinale a opção que apresenta a principal desvantagem da adoção do esquema Snowflake em comparação com o esquema Star na otimização de consultas OLAP.
Uma característica fundamental de um Data Warehouse em comparação com um Banco de Dados Transacional reside no fato de que
I. Sofrem muitas operações de atualização de dados e tem alta normalização de dados.
II. São orientados por assunto e tem baixa volatidades dos dados.
III. Apresentam alta agregação de dados e baixa suporte a dados não relacionais.
Está correto o que se afirma em
O tipo de dimensão que permite armazenar os flags e indicadores ou coleções de dados transacionais aleatórios que não estão relacionados a nenhuma outra dimensão específica se denominada
Considerando os impactos dessa decisão de projeto e os fundamentos da modelagem de dados, é correto afirmar que:
O administrador de banco de dados (DBA), preocupado com a integridade dos dados e o espaço de armazenamento, propôs que essa hierarquia fosse modelada seguindo os princípios da normalização. Segundo a proposta, a tabela de produtos conteria apenas o ID da subcategoria, que apontaria para uma tabela de subcategorias, que, por sua vez, apontaria para uma tabela de categorias, e assim sucessivamente, evitando a repetição de textos descritivos (como o nome do departamento) em milhões de linhas de produtos.
Considerando os conceitos de modelagem dimensional (Ralph Kimball) e o impacto dessa decisão na performance de consultas analíticas (OLAP), é correto afirmar que:
Considerando os impactos dessa decisão de projeto e os fundamentos da modelagem de dados, é correto afirmar que:
O administrador de banco de dados (DBA), preocupado com a integridade dos dados e o espaço de armazenamento, propôs que essa hierarquia fosse modelada seguindo os princípios da normalização. Segundo a proposta, a tabela de produtos conteria apenas o ID da subcategoria, que apontaria para uma tabela de subcategorias, que, por sua vez, apontaria para uma tabela de categorias, e assim sucessivamente, evitando a repetição de textos descritivos (como o nome do departamento) em milhões de linhas de produtos.
Considerando os conceitos de modelagem dimensional (Ralph Kimball) e o impacto dessa decisão na performance de consultas analíticas (OLAP), é correto afirmar que:
Considerando os impactos dessa decisão de projeto e os fundamentos da modelagem de dados, é correto afirmar que:
O administrador de banco de dados (DBA), preocupado com a integridade dos dados e o espaço de armazenamento, propôs que essa hierarquia fosse modelada seguindo os princípios da normalização. Segundo a proposta, a tabela de produtos conteria apenas o ID da subcategoria, que apontaria para uma tabela de subcategorias, que, por sua vez, apontaria para uma tabela de categorias, e assim sucessivamente, evitando a repetição de textos descritivos (como o nome do departamento) em milhões de linhas de produtos.
Considerando os conceitos de modelagem dimensional (Ralph Kimball) e o impacto dessa decisão na performance de consultas analíticas (OLAP), é correto afirmar que:
Considerando a modelagem multidimensional, assinale a opção que apresenta corretamente a estrutura que é mais adequada para organizar os dados, de forma que permita análises OLAP eficientes com agregações em diferentes níveis de granularidade.
I. O Snowflake processa consultas usando clusters de computação MPP.
II. Cada warehouse virtual é um cluster de computação independente que não compartilha recursos computacionais com outros warehouses virtuais.
III. A autenticação é um serviço que é gerenciado dentro da camada de serviços de nuvem.
IV. A arquitetura do Snowflake consiste em três camadas principais, sendo elas: armazenamento de banco de dados; dimensionamento de consultas e serviços de nuvem.
Esses dois métodos são conhecidos, respectivamente, pelas siglas:
I.Eliminação - Durante essa etapa, o ETL identifica os dados duplicados e os remove de suas origens, de forma que possa transportar somente os dados limpos para o destino. Os dados podem vir de fontes estruturadas e não estruturadas, incluindo documentos, e-mails, aplicações de negócios, bancos de dados, equipamentos, sensores, terceiros e muito mais.
II.Transformação - Como os dados extraídos são brutos em sua forma original, eles precisam ser mapeados e transformados para prepará-los para o armazenamento de dados eventual. No processo de transformação, o ETL valida, autentica, deduplica e/ou agrega os dados de formas que tornam os dados resultantes confiáveis e consultáveis.
III.Limpeza - Durante essa etapa, o ETL limpa os dados transformados para o armazenamento otimizado no destino. Esta etapa pode implicar o carregamento inicial de todos os dados de origem ou pode ser o carregamento de alterações incrementais nos dados de origem.
É CORRETO o que se afirma em: