Questões de Concurso Comentadas sobre big data em banco de dados

Foram encontradas 341 questões

Q4036220 Banco de Dados
Um Analista de Sistemas, que atua em uma agência de fomento vinculada ao setor governamental, está trabalhando com o Hadoop para processar e analisar grandes volumes de dados armazenados no HDFS (Hadoop Distributed File System). Ele precisa consultar esses dados de forma rápida e eficiente, utilizando uma linguagem semelhante ao SQL (Structured Query Language) para extrair informações agregadas e gerar relatórios. Considerando esse contexto, assinale a alternativa que apresenta duas ferramentas do Hadoop capazes de consultar grandes volumes de dados no HDFS, usando uma linguagem semelhante ao SQL (HiveQL/SQL):
Alternativas
Q3973797 Banco de Dados
No contexto de arquiteturas modernas de dados, data lakes são adotados para lidar com grande volume, variedade e velocidade de dados, mantendo flexibilidade para múltiplos usos analíticos, tendo como princípio a estratégia
Alternativas
Q3968385 Banco de Dados
Em um pipeline de dados, o modelo ETL (Extract, Transform, Load) caracteriza-se pela realização das transformações antes da carga dos dados no sistema de destino, enquanto o modelo ELT (Extract, Load, Transform) adia as transformações para depois da ingestão dos dados em um ambiente analítico. Nesse contexto, a alternativa mais coerente com os impactos em escalabilidade, custo computacional e planejamento em cenários de big data é: 
Alternativas
Q3961432 Banco de Dados
Em bancos de dados NoSQL, o modelo que atende conjuntos altamente conectados é chamado de 
Alternativas
Q3961429 Banco de Dados
Assinale a opção que corresponde ao modelo, em Big Data, utilizado para processar paralelamente grandes volumes de dados.
Alternativas
Q3961424 Banco de Dados
No contexto de arquiteturas modernas para o ecossistema de Big Data, a organização funcional visa gerenciar o ciclo de vida do dado sob os pilares de volume, velocidade e variedade. Considerando as camadas funcionais e os princípios de processamento distribuído, assinale a opção correta. 
Alternativas
Q3961421 Banco de Dados
No ecossistema de dados corporativos, diferentes abordagens e arquiteturas são aplicadas conforme a natureza dos dados e o objetivo analítico. A esse respeito, considere as descrições a seguir.
1 Refere-se à análise de conjuntos de dados que superam a capacidade de processamento dos sistemas convencionais, integrando alta variedade (estruturados e não estruturados) e exigindo escalabilidade horizontal.
2 Abordagem voltada a conjuntos de dados estruturados e predefinidos, com foco em descrever eventos passados (análise descritiva) e responder a perguntas de negócio por meio de indicadores históricos (KPIs).
3 Caracteriza-se pelo processamento de fluxos (streams) com alta velocidade, em que a geração de valor depende da capacidade de processar e reagir à informação em tempo real ou quase real.
4 Utiliza métodos científicos, estatísticos e modelos computacionais para realizar análises preditivas e prescritivas, visando a descoberta de padrões e a antecipação de tendências.
Assinale a opção correta.
Alternativas
Q3956764 Banco de Dados
A Secretaria da Fazenda de determinado Estado implementou uma solução corporativa para centralizar dados fiscais provenientes de múltiplas fontes heterogêneas: declarações de contribuintes, notas fiscais eletrônicas, dados cadastrais e informações de fiscalizações. A equipe técnica precisava garantir escalabilidade, processamento de grandes volumes e capacidade analítica para identificar irregularidades tributárias. Após análise, optou-se por uma arquitetura que permite armazenar dados brutos em formato nativo, aplicar transformações sob demanda mediante ferramentas de processamento distribuído e disponibilizar estruturas otimizadas para consultas analíticas pelos auditores fiscais, mantendo a governança através de controles transacionais sobre os metadados.

A arquitetura implementada
Alternativas
Q3952847 Banco de Dados
Em relação aos repositórios de dados data lake e data warehouse em arquiteturas de Big Data, analise as afirmativas a seguir.

I. Um data lake é caracterizado por priorizar a ingestão de dados em seu formato original, permitindo armazenar dados estruturados, semiestruturados e não estruturados, com uso de abordagens de schema-on-read.
II. Um data warehouse adota schema-on-write, exigindo modelagem prévia, como esquemas em estrela ou floco de neve, para suportar consultas analíticas otimizadas.
III. A simples adoção de schema-on-write em um data lake o caracteriza automaticamente como um data warehouse.

É verdadeiro o que se afirma em
Alternativas
Q3940740 Banco de Dados

Relacione a Coluna 1 com a Coluna 2 e assinale a alternativa que apresenta a sequência numérica correta.



Coluna 1 Ferramentas



1. Apache Spark


2. Apache Kafka


3. Power BI



Coluna 2 Descrição



( ) é um framework de computação distribuída de alta velocidade para processamento de Big Data.


( ) é uma plataforma de streaming de eventos distribuída, utilizada para construir pipelines de dados em tempo real.


( ) é uma ferramenta de Business Intelligence da Microsoft para visualização de dados e criação de dashboards interativos.



Assinale a alternativa que indica a sequência correta, de cima para baixo.

Alternativas
Q3940727 Banco de Dados

O conceito de Big Data refere-se a conjuntos de dados extremamente grandes e complexos. Uma arquitetura comum para lidar com Big Data é o Data Lake.



Qual a principal característica de um Data Lake?

Alternativas
Q3926899 Banco de Dados
Uma equipe de auditoria possui uma tabela de NF-e com mais de 1 bilhão de registros em um pyspark.sgl.DataFrame chamado df. A auditora deseja inspecionar apenas 1.000 registros localmente em seu notebook, usando funcionalidades avangadas de pandas para buscar inconsisténcias. Nesse cenário, a abordagem em PySpark mais apropriada para gerar esses registros em um pandas. DataFrame, minimizando o risco de estouro de memória no ambiente local é: 
Alternativas
Q3926893 Banco de Dados
Uma Secretaria da Fazenda projeta um Data Lake para suportar fiscalização eletrônica, com ingestão diária de notas fiscais eletrônicas, conhecimentos eletrônicos de transporte de cargas, registros fiscais digitais entregues ao fisco, declarações do SIMPLES Nacional e recolhimentos. A equipe adota uma arquitetura em zonas (raw/bronze, refined/silver, curated/gold), com processos de ELT. Para o uso por auditores fiscais e cientistas de dados, a descrição mais adequada é que a zona raw/bronze
Alternativas
Q3907818 Banco de Dados
O Data Lakehouse integra governança, desempenho analítico e flexibilidade de dados brutos, combinando controle transacional com processamento escalável em um único ambiente; assinale a alternativa correta.
Alternativas
Q3869749 Banco de Dados
Diferentes sistemas produzem dados em formatos variados, que podem ser classificados em dados estruturados, semiestruturados ou não estruturados.
Nesse contexto, relacione os tipos de dados às suas respectivas descrições.
1. Dados estruturados
2. Dados semiestruturados
3. Dados não estruturados
( ) Gravações em áudio e vídeo de audiências públicas, armazenadas em arquivos MP4, acompanhadas apenas de nome do arquivo e data de criação.
( ) Registros de protocolo eletrônico armazenados em tabelas de banco de dados relacional, com campos bem definidos (número do processo, data, unidade, assunto) e chaves primárias/estrangeiras.
( ) Arquivos de log de acesso ao portal de serviços do governo, registrados em formato JSON, contendo campos como timestamp, user_id, endpoint, status_code, com alguns campos opcionais variando conforme o tipo de requisição.
A sequência correta é: 
Alternativas
Q3869738 Banco de Dados
Uma corporação multinacional do setor de varejo está unificando suas plataformas de dados. O cenário atual apresenta dois desafios distintos, indicados a seguir.
• Transacional e BI: o sistema de vendas gera registros financeiros que exigem consistência estrita (ACID). A equipe de analistas de negócios consome esses dados via painéis de BI que demandam baixa latência em consultas complexas com múltiplas junções (joins).
• Big Data e IA: o sistema de e-commerce gera petabytes de logs de navegação (clickstream) e dados de sensores IoT das lojas físicas (dados semiestruturados). A equipe de ciência de dados precisa acessar esses dados em seu formato bruto para treinar modelos preditivos, sem a perda de informações causada por agregações prematuras.
O arquiteto de dados precisa propor uma solução única que evite a duplicação de dados entre silos (um Data Warehouse para o BI e um Data Lake para a IA) e reduza o custo de armazenamento, mantendo a governança.
Considerando os requisitos apresentados e as características das arquiteturas modernas de dados, a abordagem arquitetural e de modelagem adequada é: 
Alternativas
Q3866609 Banco de Dados
Em iniciativas de Business Intelligence que coexistem com ambientes de Big Data, é comum a adoção de arquiteturas híbridas, nas quais datamarts tradicionais convivem com plataformas analíticas distribuídas. Considerando a modelagem de datamarts, os processos de ETL e os conceitos de Big Data e Analytics, assinale a alternativa que apresenta a afirmativa correta: 
Alternativas
Q3856610 Banco de Dados
Os data lakes
Alternativas
Ano: 2026 Banca: FGV Órgão: AMAZUL Prova: FGV - 2026 - AMAZUL - Analista de Negócios |
Q3851686 Banco de Dados
A análise de dados passou a ser aplicada em diversos setores, originando vocabulários e práticas específicas conforme o domínio analisado. Essa diversificação ocorre porque, embora muitas técnicas sejam comuns, cada área possui características próprias que influenciam coleta, processamento e aplicação dos dados.

Considerando essas aplicações verticais, assinale a opção que apresenta um exemplo típico de domínio em que a análise de dados tem sido amplamente utilizada.
Alternativas
Q3825656 Banco de Dados
Em big data, a característica relacionada aos diferentes formatos de informações é denominada
Alternativas
Respostas
1: A
2: D
3: A
4: E
5: C
6: A
7: A
8: A
9: A
10: A
11: B
12: C
13: E
14: C
15: D
16: E
17: D
18: A
19: D
20: D