Questões de Concurso
Comentadas sobre big data em banco de dados
Foram encontradas 341 questões
1 Refere-se à análise de conjuntos de dados que superam a capacidade de processamento dos sistemas convencionais, integrando alta variedade (estruturados e não estruturados) e exigindo escalabilidade horizontal.
2 Abordagem voltada a conjuntos de dados estruturados e predefinidos, com foco em descrever eventos passados (análise descritiva) e responder a perguntas de negócio por meio de indicadores históricos (KPIs).
3 Caracteriza-se pelo processamento de fluxos (streams) com alta velocidade, em que a geração de valor depende da capacidade de processar e reagir à informação em tempo real ou quase real.
4 Utiliza métodos científicos, estatísticos e modelos computacionais para realizar análises preditivas e prescritivas, visando a descoberta de padrões e a antecipação de tendências.
Assinale a opção correta.
A arquitetura implementada
I. Um data lake é caracterizado por priorizar a ingestão de dados em seu formato original, permitindo armazenar dados estruturados, semiestruturados e não estruturados, com uso de abordagens de schema-on-read.
II. Um data warehouse adota schema-on-write, exigindo modelagem prévia, como esquemas em estrela ou floco de neve, para suportar consultas analíticas otimizadas.
III. A simples adoção de schema-on-write em um data lake o caracteriza automaticamente como um data warehouse.
É verdadeiro o que se afirma em
Relacione a Coluna 1 com a Coluna 2 e assinale a alternativa que apresenta a sequência numérica correta.
Coluna 1 Ferramentas
1. Apache Spark
2. Apache Kafka
3. Power BI
Coluna 2 Descrição
( ) é um framework de computação distribuída de alta velocidade para processamento de Big Data.
( ) é uma plataforma de streaming de eventos distribuída, utilizada para construir pipelines de dados em tempo real.
( ) é uma ferramenta de Business Intelligence da Microsoft para visualização de dados e criação de dashboards interativos.
Assinale a alternativa que indica a sequência correta, de cima para baixo.
O conceito de Big Data refere-se a conjuntos de dados extremamente grandes e complexos. Uma arquitetura comum para lidar com Big Data é o Data Lake.
Qual a principal característica de um Data Lake?
Nesse contexto, relacione os tipos de dados às suas respectivas descrições.
1. Dados estruturados
2. Dados semiestruturados
3. Dados não estruturados
( ) Gravações em áudio e vídeo de audiências públicas, armazenadas em arquivos MP4, acompanhadas apenas de nome do arquivo e data de criação.
( ) Registros de protocolo eletrônico armazenados em tabelas de banco de dados relacional, com campos bem definidos (número do processo, data, unidade, assunto) e chaves primárias/estrangeiras.
( ) Arquivos de log de acesso ao portal de serviços do governo, registrados em formato JSON, contendo campos como timestamp, user_id, endpoint, status_code, com alguns campos opcionais variando conforme o tipo de requisição.
A sequência correta é:
• Transacional e BI: o sistema de vendas gera registros financeiros que exigem consistência estrita (ACID). A equipe de analistas de negócios consome esses dados via painéis de BI que demandam baixa latência em consultas complexas com múltiplas junções (joins).
• Big Data e IA: o sistema de e-commerce gera petabytes de logs de navegação (clickstream) e dados de sensores IoT das lojas físicas (dados semiestruturados). A equipe de ciência de dados precisa acessar esses dados em seu formato bruto para treinar modelos preditivos, sem a perda de informações causada por agregações prematuras.
O arquiteto de dados precisa propor uma solução única que evite a duplicação de dados entre silos (um Data Warehouse para o BI e um Data Lake para a IA) e reduza o custo de armazenamento, mantendo a governança.
Considerando os requisitos apresentados e as características das arquiteturas modernas de dados, a abordagem arquitetural e de modelagem adequada é:
Considerando essas aplicações verticais, assinale a opção que apresenta um exemplo típico de domínio em que a análise de dados tem sido amplamente utilizada.