Questões de Concurso
Sobre big data em banco de dados
Foram encontradas 379 questões
1 Refere-se à análise de conjuntos de dados que superam a capacidade de processamento dos sistemas convencionais, integrando alta variedade (estruturados e não estruturados) e exigindo escalabilidade horizontal.
2 Abordagem voltada a conjuntos de dados estruturados e predefinidos, com foco em descrever eventos passados (análise descritiva) e responder a perguntas de negócio por meio de indicadores históricos (KPIs).
3 Caracteriza-se pelo processamento de fluxos (streams) com alta velocidade, em que a geração de valor depende da capacidade de processar e reagir à informação em tempo real ou quase real.
4 Utiliza métodos científicos, estatísticos e modelos computacionais para realizar análises preditivas e prescritivas, visando a descoberta de padrões e a antecipação de tendências.
Assinale a opção correta.
A arquitetura implementada
I. Um data lake é caracterizado por priorizar a ingestão de dados em seu formato original, permitindo armazenar dados estruturados, semiestruturados e não estruturados, com uso de abordagens de schema-on-read.
II. Um data warehouse adota schema-on-write, exigindo modelagem prévia, como esquemas em estrela ou floco de neve, para suportar consultas analíticas otimizadas.
III. A simples adoção de schema-on-write em um data lake o caracteriza automaticamente como um data warehouse.
É verdadeiro o que se afirma em
Relacione a Coluna 1 com a Coluna 2 e assinale a alternativa que apresenta a sequência numérica correta.
Coluna 1 Ferramentas
1. Apache Spark
2. Apache Kafka
3. Power BI
Coluna 2 Descrição
( ) é um framework de computação distribuída de alta velocidade para processamento de Big Data.
( ) é uma plataforma de streaming de eventos distribuída, utilizada para construir pipelines de dados em tempo real.
( ) é uma ferramenta de Business Intelligence da Microsoft para visualização de dados e criação de dashboards interativos.
Assinale a alternativa que indica a sequência correta, de cima para baixo.
O conceito de Big Data refere-se a conjuntos de dados extremamente grandes e complexos. Uma arquitetura comum para lidar com Big Data é o Data Lake.
Qual a principal característica de um Data Lake?
Acerca de data warehouse, data lake, data mesh, CI/CD e ETL, julgue o item a seguir.
A construção de um data mesh parte do princípio de propriedade de domínio, conforme o qual as equipes de cada domínio assumem a responsabilidade por seus dados.
No que diz respeito a Big Data, ETL/ELT e metadados, julgue o próximo item.
Em um data lake, os dados brutos podem ser carregados sem que seja necessário um pré-processamento, como o ETL, para a padronização das informações.
No que concerne a inteligência artificial, análise de dados e Big Data, julgue o item que se segue.
Um dos 5 Vs do Big Data refere-se à variedade, que designa a possibilidade de armazenamento de diferentes tipos de dados: estruturados, semiestruturados e não estruturados.
A classificação das características básicas da qualidade de dados são, respectivamente,
Nesse contexto, relacione os tipos de dados às suas respectivas descrições.
1. Dados estruturados
2. Dados semiestruturados
3. Dados não estruturados
( ) Gravações em áudio e vídeo de audiências públicas, armazenadas em arquivos MP4, acompanhadas apenas de nome do arquivo e data de criação.
( ) Registros de protocolo eletrônico armazenados em tabelas de banco de dados relacional, com campos bem definidos (número do processo, data, unidade, assunto) e chaves primárias/estrangeiras.
( ) Arquivos de log de acesso ao portal de serviços do governo, registrados em formato JSON, contendo campos como timestamp, user_id, endpoint, status_code, com alguns campos opcionais variando conforme o tipo de requisição.
A sequência correta é:
• Transacional e BI: o sistema de vendas gera registros financeiros que exigem consistência estrita (ACID). A equipe de analistas de negócios consome esses dados via painéis de BI que demandam baixa latência em consultas complexas com múltiplas junções (joins).
• Big Data e IA: o sistema de e-commerce gera petabytes de logs de navegação (clickstream) e dados de sensores IoT das lojas físicas (dados semiestruturados). A equipe de ciência de dados precisa acessar esses dados em seu formato bruto para treinar modelos preditivos, sem a perda de informações causada por agregações prematuras.
O arquiteto de dados precisa propor uma solução única que evite a duplicação de dados entre silos (um Data Warehouse para o BI e um Data Lake para a IA) e reduza o custo de armazenamento, mantendo a governança.
Considerando os requisitos apresentados e as características das arquiteturas modernas de dados, a abordagem arquitetural e de modelagem adequada é:
Considerando essas aplicações verticais, assinale a opção que apresenta um exemplo típico de domínio em que a análise de dados tem sido amplamente utilizada.
I. O Snowflake processa consultas usando clusters de computação MPP.
II. Cada warehouse virtual é um cluster de computação independente que não compartilha recursos computacionais com outros warehouses virtuais.
III. A autenticação é um serviço que é gerenciado dentro da camada de serviços de nuvem.
IV. A arquitetura do Snowflake consiste em três camadas principais, sendo elas: armazenamento de banco de dados; dimensionamento de consultas e serviços de nuvem.