Questões de Concurso Sobre big data em banco de dados

Foram encontradas 379 questões

Q3961424 Banco de Dados
No contexto de arquiteturas modernas para o ecossistema de Big Data, a organização funcional visa gerenciar o ciclo de vida do dado sob os pilares de volume, velocidade e variedade. Considerando as camadas funcionais e os princípios de processamento distribuído, assinale a opção correta. 
Alternativas
Q3961421 Banco de Dados
No ecossistema de dados corporativos, diferentes abordagens e arquiteturas são aplicadas conforme a natureza dos dados e o objetivo analítico. A esse respeito, considere as descrições a seguir.
1 Refere-se à análise de conjuntos de dados que superam a capacidade de processamento dos sistemas convencionais, integrando alta variedade (estruturados e não estruturados) e exigindo escalabilidade horizontal.
2 Abordagem voltada a conjuntos de dados estruturados e predefinidos, com foco em descrever eventos passados (análise descritiva) e responder a perguntas de negócio por meio de indicadores históricos (KPIs).
3 Caracteriza-se pelo processamento de fluxos (streams) com alta velocidade, em que a geração de valor depende da capacidade de processar e reagir à informação em tempo real ou quase real.
4 Utiliza métodos científicos, estatísticos e modelos computacionais para realizar análises preditivas e prescritivas, visando a descoberta de padrões e a antecipação de tendências.
Assinale a opção correta.
Alternativas
Q3956764 Banco de Dados
A Secretaria da Fazenda de determinado Estado implementou uma solução corporativa para centralizar dados fiscais provenientes de múltiplas fontes heterogêneas: declarações de contribuintes, notas fiscais eletrônicas, dados cadastrais e informações de fiscalizações. A equipe técnica precisava garantir escalabilidade, processamento de grandes volumes e capacidade analítica para identificar irregularidades tributárias. Após análise, optou-se por uma arquitetura que permite armazenar dados brutos em formato nativo, aplicar transformações sob demanda mediante ferramentas de processamento distribuído e disponibilizar estruturas otimizadas para consultas analíticas pelos auditores fiscais, mantendo a governança através de controles transacionais sobre os metadados.

A arquitetura implementada
Alternativas
Q3952847 Banco de Dados
Em relação aos repositórios de dados data lake e data warehouse em arquiteturas de Big Data, analise as afirmativas a seguir.

I. Um data lake é caracterizado por priorizar a ingestão de dados em seu formato original, permitindo armazenar dados estruturados, semiestruturados e não estruturados, com uso de abordagens de schema-on-read.
II. Um data warehouse adota schema-on-write, exigindo modelagem prévia, como esquemas em estrela ou floco de neve, para suportar consultas analíticas otimizadas.
III. A simples adoção de schema-on-write em um data lake o caracteriza automaticamente como um data warehouse.

É verdadeiro o que se afirma em
Alternativas
Q3940740 Banco de Dados

Relacione a Coluna 1 com a Coluna 2 e assinale a alternativa que apresenta a sequência numérica correta.



Coluna 1 Ferramentas



1. Apache Spark


2. Apache Kafka


3. Power BI



Coluna 2 Descrição



( ) é um framework de computação distribuída de alta velocidade para processamento de Big Data.


( ) é uma plataforma de streaming de eventos distribuída, utilizada para construir pipelines de dados em tempo real.


( ) é uma ferramenta de Business Intelligence da Microsoft para visualização de dados e criação de dashboards interativos.



Assinale a alternativa que indica a sequência correta, de cima para baixo.

Alternativas
Q3940727 Banco de Dados

O conceito de Big Data refere-se a conjuntos de dados extremamente grandes e complexos. Uma arquitetura comum para lidar com Big Data é o Data Lake.



Qual a principal característica de um Data Lake?

Alternativas
Q3926899 Banco de Dados
Uma equipe de auditoria possui uma tabela de NF-e com mais de 1 bilhão de registros em um pyspark.sgl.DataFrame chamado df. A auditora deseja inspecionar apenas 1.000 registros localmente em seu notebook, usando funcionalidades avangadas de pandas para buscar inconsisténcias. Nesse cenário, a abordagem em PySpark mais apropriada para gerar esses registros em um pandas. DataFrame, minimizando o risco de estouro de memória no ambiente local é: 
Alternativas
Q3926893 Banco de Dados
Uma Secretaria da Fazenda projeta um Data Lake para suportar fiscalização eletrônica, com ingestão diária de notas fiscais eletrônicas, conhecimentos eletrônicos de transporte de cargas, registros fiscais digitais entregues ao fisco, declarações do SIMPLES Nacional e recolhimentos. A equipe adota uma arquitetura em zonas (raw/bronze, refined/silver, curated/gold), com processos de ELT. Para o uso por auditores fiscais e cientistas de dados, a descrição mais adequada é que a zona raw/bronze
Alternativas
Q3907818 Banco de Dados
O Data Lakehouse integra governança, desempenho analítico e flexibilidade de dados brutos, combinando controle transacional com processamento escalável em um único ambiente; assinale a alternativa correta.
Alternativas
Q3906554 Banco de Dados

Acerca de data warehouse, data lake, data mesh, CI/CD e ETL, julgue o item a seguir. 


A construção de um data mesh parte do princípio de propriedade de domínio, conforme o qual as equipes de cada domínio assumem a responsabilidade por seus dados. 

Alternativas
Q3886854 Banco de Dados

No que diz respeito a Big Data, ETL/ELT e metadados, julgue o próximo item.


Em um data lake, os dados brutos podem ser carregados sem que seja necessário um pré-processamento, como o ETL, para a padronização das informações.

Alternativas
Q3886845 Banco de Dados

No que concerne a inteligência artificial, análise de dados e Big Data, julgue o item que se segue.


Um dos 5 Vs do Big Data refere-se à variedade, que designa a possibilidade de armazenamento de diferentes tipos de dados: estruturados, semiestruturados e não estruturados. 

Alternativas
Q3880222 Banco de Dados
A importância da qualidade dos dados é um dos fundamentos da Ciência da Dados, é essencial nos projetos desenvolvidos na ALEGO. Tais características são bem delineadas e classificadas na literatura e, em essência, servem de indicadores para avaliar quais conjuntos de dados são importantes ou não para um determinado estudo.

A classificação das características básicas da qualidade de dados são, respectivamente,
Alternativas
Q3869749 Banco de Dados
Diferentes sistemas produzem dados em formatos variados, que podem ser classificados em dados estruturados, semiestruturados ou não estruturados.
Nesse contexto, relacione os tipos de dados às suas respectivas descrições.
1. Dados estruturados
2. Dados semiestruturados
3. Dados não estruturados
( ) Gravações em áudio e vídeo de audiências públicas, armazenadas em arquivos MP4, acompanhadas apenas de nome do arquivo e data de criação.
( ) Registros de protocolo eletrônico armazenados em tabelas de banco de dados relacional, com campos bem definidos (número do processo, data, unidade, assunto) e chaves primárias/estrangeiras.
( ) Arquivos de log de acesso ao portal de serviços do governo, registrados em formato JSON, contendo campos como timestamp, user_id, endpoint, status_code, com alguns campos opcionais variando conforme o tipo de requisição.
A sequência correta é: 
Alternativas
Q3869738 Banco de Dados
Uma corporação multinacional do setor de varejo está unificando suas plataformas de dados. O cenário atual apresenta dois desafios distintos, indicados a seguir.
• Transacional e BI: o sistema de vendas gera registros financeiros que exigem consistência estrita (ACID). A equipe de analistas de negócios consome esses dados via painéis de BI que demandam baixa latência em consultas complexas com múltiplas junções (joins).
• Big Data e IA: o sistema de e-commerce gera petabytes de logs de navegação (clickstream) e dados de sensores IoT das lojas físicas (dados semiestruturados). A equipe de ciência de dados precisa acessar esses dados em seu formato bruto para treinar modelos preditivos, sem a perda de informações causada por agregações prematuras.
O arquiteto de dados precisa propor uma solução única que evite a duplicação de dados entre silos (um Data Warehouse para o BI e um Data Lake para a IA) e reduza o custo de armazenamento, mantendo a governança.
Considerando os requisitos apresentados e as características das arquiteturas modernas de dados, a abordagem arquitetural e de modelagem adequada é: 
Alternativas
Q3866609 Banco de Dados
Em iniciativas de Business Intelligence que coexistem com ambientes de Big Data, é comum a adoção de arquiteturas híbridas, nas quais datamarts tradicionais convivem com plataformas analíticas distribuídas. Considerando a modelagem de datamarts, os processos de ETL e os conceitos de Big Data e Analytics, assinale a alternativa que apresenta a afirmativa correta: 
Alternativas
Q3856610 Banco de Dados
Os data lakes
Alternativas
Ano: 2026 Banca: FGV Órgão: AMAZUL Prova: FGV - 2026 - AMAZUL - Analista de Negócios |
Q3851686 Banco de Dados
A análise de dados passou a ser aplicada em diversos setores, originando vocabulários e práticas específicas conforme o domínio analisado. Essa diversificação ocorre porque, embora muitas técnicas sejam comuns, cada área possui características próprias que influenciam coleta, processamento e aplicação dos dados.

Considerando essas aplicações verticais, assinale a opção que apresenta um exemplo típico de domínio em que a análise de dados tem sido amplamente utilizada.
Alternativas
Q3825656 Banco de Dados
Em big data, a característica relacionada aos diferentes formatos de informações é denominada
Alternativas
Q3991692 Banco de Dados
A respeito do Snowflake para gestão de grandes volumes de dados, analise as assertivas e assinale a alternativa que aponta as corretas.
I. O Snowflake processa consultas usando clusters de computação MPP.
II. Cada warehouse virtual é um cluster de computação independente que não compartilha recursos computacionais com outros warehouses virtuais.
III. A autenticação é um serviço que é gerenciado dentro da camada de serviços de nuvem.
IV. A arquitetura do Snowflake consiste em três camadas principais, sendo elas: armazenamento de banco de dados; dimensionamento de consultas e serviços de nuvem. 
Alternativas
Respostas
21: A
22: A
23: A
24: A
25: A
26: B
27: C
28: E
29: C
30: C
31: C
32: C
33: A
34: D
35: E
36: D
37: A
38: D
39: D
40: C