Questões de Concurso
Comentadas sobre dw - data warehouse em banco de dados
Foram encontradas 713 questões
I. Os Data Warehouses existem como armazenamento persistente em vez de serem materializados por demandas.
II. Os Data Warehouses podem ser indexados para otimizar o desempenho e, caracteristicamente, oferecem suporte específico de funcionalidades.
III. Os Data Warehouses oferecem uma grande quantidade de dados integrados e são livres das restrições do ambiente transacional, permitindo uma eficiência aumentada no processamento da consulta.
A sequência correta é
Julgue o próximo item, relativo a otimização de consulta, ETL, modelo entidade-relacionamento e bancos de dados NoSQL.
Em um data warehousing (DW), a ETL é considerada uma
das fases mais simples, pois se resume à seleção dos dados
que farão parte do DW.
A operação analítica que se caracteriza por analisar dados em níveis de agregação progressivamente mais detalhados e de menor granularidade, é denominada
I. Chamamos de ETL as ferramentas de software que são especializadas no processo de integração de dados. Elas são capazes de se conectar a diferentes fontes para extração de dados, transformar os dados quando necessário, e finalmente carrega-los na base que consolidará todas as informações importantes.
Il, O processo de transformação de dados nos permite a realização de diversas operações. A operação de transposição por exemplo, nos permite transforma linhas em colunas ou vice-versa. Já a operação de derivação ocorre quando, através de uma função de mapeamento, realizamos a mudança dos dados de domínio para um outro domínio.
III. Pentaho Data Integration, Oracle Data Integrator e Informatica Power Center são alguns exemplos de ferramentas de integração de dados conhecidas no mercado.
I. Data Warehouse armazena dados em formato de séries históricas. Os dados são armazenados neste formato pois, por definição, são considerados voláteis.
Il. Um Data Mart consulta um subconjunto de dados de um Data Warehouse. Isso ocorre pois um Data Mart é focado em um tipo específico de usuário que não precisa de acesso a todos os dados de um Data Warehouse para conseguir respostas para suas perguntas.
Ill. Ferramentas OLAP permitem ao usuário realizar operações de Drill Up e de Drill Down. Esse tipo de operação é importante pois facilita a análise de dados em diferentes níveis de granularidade.
Na modelagem multidimensional de um Data Warehouse, há dois modelos que são mais utilizados. O primeiro deles é um schema no qual somente a tabela fato e as tabelas de dimensões a ela relacionadas estão nele contidas e não é usada normalização; nesse schema, poucas junções com chave estrangeira são usadas e há menos redundância de dados. O segundo é um schema no qual a tabela fato, bem como as tabelas de dimensões e as tabelas de outras hierarquias (subdimensões) relacionadas estão nele contidas; nesse schema há mais junções com chaves estrangeiras e pode haver uma maior redundância de dados.
O primeiro e o segundo schemas são, correta e respectivamente, denominados
No contexto de modificação de valores de atributos de dimensões em modelos multidimensionais e de data warehouse, identifique o valor correto dos tipos (0, 1, 2…n) de modificação de valores de atributos de dimensão, conforme as técnicas definidas por Kimball, para:
( ) Acrescentar um novo registro
( ) Sobrescrever
( ) Reter o valor original
( ) Adicionar um novo atributo
Assinale a alternativa que indica a sequência correta, de cima para baixo.
Ordene corretamente os 4 passos do processo de design dimensional de kimball:
( ) Identificar os fatos.
( ) Selecionar o processo de negócios.
( ) Identificar as dimensões.
( ) Declarar a granularidade.
Assinale a alternativa que indica a sequência correta, de cima para baixo.
CRISP-DM é um modelo de referência não proprietário e tecnologicamente neutro que pode ser usado por iniciantes ou especialistas para descrever o ciclo de vida de projetos de Mineração de Dados em seis fases distintas.
A terceira fase do modelo corresponde
Atualmente, conforme a tecnologia evolui, novos termos vão surgindo, particularmente com o aumento da importância dos dados na criação de estratégias de crescimento e tomadas de decisão. Nesse contexto, dois termos se destacam, descritos a seguir:
I. É um repositório central de informações que podem ser analisadas para tomar decisões mais adequadas. Os dados fluem de sistemas transacionais, bancos de dados relacionais e de outras fontes. Analistas de negócios, engenheiros de dados, cientistas de dados e tomadores de decisões acessam os dados por meio de ferramentas de inteligência de negócios (BI), clientes SQL e outros aplicativos de análise.
II. É um processo analítico no qual grande quantidade de dados são explorados com o objetivo de encontrar padrões relevantes ou relação sistemática entre variáveis, os quais são validados. Todo esse processo acontece em três etapas: exploração, construção de modelo (padrão) e validação. As ferramentas empregadas analisam dados em busca de oportunidades ou problemas e fazem o diagnóstico do comportamento dos negócios. Sendo assim, cabe ao usuário utilizar o conhecimento para produzir vantagens competitivas.
Os termos descritos em I e II representam os conceitos, respectivamente, de:
I. Star Schema.
II. Bifurcação entre tabelas.
III. Snowflake.
IV. Fullflake.
V. Dimension Only.
Quais estão corretas?