Questões de Banco de Dados - Big Data para Concurso

Q4036220

Ano: 2026 Banca: Instituto Legalle Órgão: BADESUL - RS Prova: Instituto Legalle - 2026 - BADESUL - RS - Técnico em Desenvolvimento - Analista de Sistemas (Ênfase em Administrador de Banco de Dados) |

Q4036220 Banco de Dados

Um Analista de Sistemas, que atua em uma agência de fomento vinculada ao setor governamental, está trabalhando com o Hadoop para processar e analisar grandes volumes de dados armazenados no HDFS (Hadoop Distributed File System). Ele precisa consultar esses dados de forma rápida e eficiente, utilizando uma linguagem semelhante ao SQL (Structured Query Language) para extrair informações agregadas e gerar relatórios. Considerando esse contexto, assinale a alternativa que apresenta duas ferramentas do Hadoop capazes de consultar grandes volumes de dados no HDFS, usando uma linguagem semelhante ao SQL (HiveQL/SQL):

A

Apache Hive e Apache Impala.

B

Data Lake e Apache Flink.

C

Apache Storm e Apache Kafka.

D

Apache Spark e Apache Storm.

E

Apache Flink e Apache Kafka.

Incorreta. Gabarito oficial da banca:

Veja esse conteúdo explicado passo a passo em nossos cursos. Buscar curso

Parabéns! Você acertou!

Mandou bem! Revise esse tema nos nossos cursos. Buscar curso

Q3973797

Ano: 2026 Banca: CESPE / CEBRASPE Órgão: IPAAM Prova: CESPE / CEBRASPE - 2026 - IPAAM - Analista Ambiental – Especialidade: Análise de Sistemas |

Q3973797 Banco de Dados

No contexto de arquiteturas modernas de dados, data lakes são adotados para lidar com grande volume, variedade e velocidade de dados, mantendo flexibilidade para múltiplos usos analíticos, tendo como princípio a estratégia

A

de cubos.

B

de normalização.

C

OLTP.

D

schema-on-read.

E

schema-on-write.

Incorreta. Gabarito oficial da banca:

Esse erro também aparece no seu Resumão. Veja o que melhorar

Parabéns! Você acertou!

Esse acerto está no seu Resumão. Ver Resumão da semana

Q3968385

Ano: 2026 Banca: FADESP Órgão: SEFAZ-PA Prova: FADESP - 2026 - SEFAZ-PA - Analista Fazendário |

Q3968385 Banco de Dados

Em um pipeline de dados, o modelo ETL (Extract, Transform, Load) caracteriza-se pela realização das transformações antes da carga dos dados no sistema de destino, enquanto o modelo ELT (Extract, Load, Transform) adia as transformações para depois da ingestão dos dados em um ambiente analítico. Nesse contexto, a alternativa mais coerente com os impactos em escalabilidade, custo computacional e planejamento em cenários de big data é:

A

Em pipelines baseados em ETL, as transformações realizadas antes da carga exigem maior planejamento das regras de negócio, dos recursos computacionais intermediários e dos custos de processamento, especialmente quando o volume de dados é elevado.

B

O modelo ELT pressupõe que todas as transformações sejam simples e de baixo custo, pois a escalabilidade do ambiente analítico dispensa preocupações com uso de recursos computacionais.

C

Em ambientes de big data, o uso de ETL elimina a necessidade de planejamento prévio da infraestrutura, uma vez que as transformações são realizadas fora do sistema de destino, reduzindo custos operacionais.

D

A adoção de ELT inviabiliza práticas de governança e controle de qualidade, uma vez que dados brutos são carregados sem transformação prévia.

E

ETL e ELT apresentam impactos equivalentes em termos de custo e desempenho, sendo a escolha entre eles determinada pela ferramenta de orquestração adotada.

Incorreta. Gabarito oficial da banca:

Veja como esse erro impacta seu desempenho geral. Ver estatísticas

Parabéns! Você acertou!

Esse acerto melhora seu desempenho! Veja suas estatísticas

Q3961432

Ano: 2026 Banca: CESPE / CEBRASPE Órgão: SEFAZ-RN Prova: CESPE / CEBRASPE - 2026 - SEFAZ-RN - Auditor Fiscal de Receitas Estaduais - conhecimentos complementares |

Q3961432 Banco de Dados

Em bancos de dados NoSQL, o modelo que atende conjuntos altamente conectados é chamado de

A

documentos.

B

memória.

C

pesquisa.

D

chave-valor.

E

grafos.

Incorreta. Gabarito oficial da banca:

Veja esse conteúdo explicado passo a passo em nossos cursos. Buscar curso

Parabéns! Você acertou!

Mandou bem! Revise esse tema nos nossos cursos. Buscar curso

Q3961429

Ano: 2026 Banca: CESPE / CEBRASPE Órgão: SEFAZ-RN Prova: CESPE / CEBRASPE - 2026 - SEFAZ-RN - Auditor Fiscal de Receitas Estaduais - conhecimentos complementares |

Q3961429 Banco de Dados

Assinale a opção que corresponde ao modelo, em Big Data, utilizado para processar paralelamente grandes volumes de dados.

A

process control

B

data break

C

map reduce

D

file management

E

volume parallel

Incorreta. Gabarito oficial da banca:

Compare seu desempenho com quem faz o mesmo concurso. Ver concorrência

Parabéns! Você acertou!

Compare seu desempenho com quem faz o mesmo concurso. Ver concorrência

Q3961424

Ano: 2026 Banca: CESPE / CEBRASPE Órgão: SEFAZ-RN Prova: CESPE / CEBRASPE - 2026 - SEFAZ-RN - Auditor Fiscal de Receitas Estaduais - conhecimentos complementares |

Q3961424 Banco de Dados

No contexto de arquiteturas modernas para o ecossistema de Big Data, a organização funcional visa gerenciar o ciclo de vida do dado sob os pilares de volume, velocidade e variedade. Considerando as camadas funcionais e os princípios de processamento distribuído, assinale a opção correta.

A

O processamento de dados pode ser viabilizado por modelos de computação distribuída, permitindo a execução de cargas de trabalho tanto em lotes (batch) quanto em fluxos contínuos (streaming), visando à conversão de dados brutos em informações estruturadas ou semiestruturadas para consumo posterior.

B

Em arquiteturas de Big Data, o paradigma predominante é o schema-on-write, que exige que todos os dados (mesmo os não estruturados) sejam validados e tipados rigidamente antes de serem persistidos no sistema de armazenamento.

C

A camada de consumo ou visualização é opcional, dado que a extração de valor e o suporte à decisão ocorrem de forma automática e intrínseca durante o processo de transporte de dados entre os nós do cluster.

D

A camada de persistência em Big Data fundamenta-se obrigatoriamente em sistemas relacionais com propriedades ACID, visando garantir a integridade referencial estrita em todas as etapas do pipeline.

E

A camada de ingestão limita-se à coleta de dados em repouso via processos puramente batch, sendo tecnicamente incapaz de capturar fluxos de dados contínuos originados de sensores ou logs.

Incorreta. Gabarito oficial da banca:

Treine mais com um simulado focado no seu concurso. Criar simulado

Parabéns! Você acertou!

Está mandando bem! Treine mais em um simulado completo. Criar simulado

Q3961421

Ano: 2026 Banca: CESPE / CEBRASPE Órgão: SEFAZ-RN Prova: CESPE / CEBRASPE - 2026 - SEFAZ-RN - Auditor Fiscal de Receitas Estaduais - conhecimentos complementares |

Q3961421 Banco de Dados

No ecossistema de dados corporativos, diferentes abordagens e arquiteturas são aplicadas conforme a natureza dos dados e o objetivo analítico. A esse respeito, considere as descrições a seguir.
1 Refere-se à análise de conjuntos de dados que superam a capacidade de processamento dos sistemas convencionais, integrando alta variedade (estruturados e não estruturados) e exigindo escalabilidade horizontal.
2 Abordagem voltada a conjuntos de dados estruturados e predefinidos, com foco em descrever eventos passados (análise descritiva) e responder a perguntas de negócio por meio de indicadores históricos (KPIs).
3 Caracteriza-se pelo processamento de fluxos (streams) com alta velocidade, em que a geração de valor depende da capacidade de processar e reagir à informação em tempo real ou quase real.
4 Utiliza métodos científicos, estatísticos e modelos computacionais para realizar análises preditivas e prescritivas, visando a descoberta de padrões e a antecipação de tendências.
Assinale a opção correta.

A

As descrições 1 e 3 apresentam características fundamentais do conceito de Big Data: volume, variedade e velocidade.

B

As descrições 2 e 4 descrevem exclusivamente as propriedades tecnológicas de sistemas de Big Data.

C

As descrições 1 e 2 referem-se estritamente à análise de dados tradicional e ao business intelligence (BI), respectivamente.

D

As descrições 3 e 4 descrevem, respectivamente, processos de armazenamento estático e persistência de dados em data warehouses.

E

Todas as descrições correspondem ao conceito de ciência de dados

Incorreta. Gabarito oficial da banca:

Esse erro também aparece no seu Resumão. Veja o que melhorar

Parabéns! Você acertou!

Esse acerto está no seu Resumão. Ver Resumão da semana

Q3956764

Ano: 2026 Banca: FCC Órgão: SEFAZ-SP Prova: FCC - 2026 - SEFAZ-SP - Auditor Fiscal da Receita Estadual - AFRE - Gestão Tributária - Conhecimentos Específicos (P3) |

Q3956764 Banco de Dados

A Secretaria da Fazenda de determinado Estado implementou uma solução corporativa para centralizar dados fiscais provenientes de múltiplas fontes heterogêneas: declarações de contribuintes, notas fiscais eletrônicas, dados cadastrais e informações de fiscalizações. A equipe técnica precisava garantir escalabilidade, processamento de grandes volumes e capacidade analítica para identificar irregularidades tributárias. Após análise, optou-se por uma arquitetura que permite armazenar dados brutos em formato nativo, aplicar transformações sob demanda mediante ferramentas de processamento distribuído e disponibilizar estruturas otimizadas para consultas analíticas pelos auditores fiscais, mantendo a governança através de controles transacionais sobre os metadados.

A arquitetura implementada

A

constitui um Data Lakehouse, que combina a flexibilidade do armazenamento de dados brutos em formato nativo com capacidades de processamento estruturado e consultas analíticas otimizadas, aplicando camadas de gerenciamento transacional sobre metadados mediante protocolos como Delta Lake ou Apache Iceberg, viabilizando transformações sob demanda e governança de dados para análises tributárias complexas.

B

representa um Data Lake federado com camadas de virtualização, que integram fontes heterogêneas mediante conectores distribuídos sem replicação física dos dados, aplicando transformações em tempo real através de processamento streaming para disponibilizar visões consolidadas aos usuários fiscais, mantendo os dados originais nos sistemas de origem com acesso mediante queries federadas.

C

corresponde a um Data Warehouse tradicional, pois consolida dados estruturados mediante processos ETL prévios, aplicando modelagem dimensional em esquema estrela para viabilizar consultas OLAP pelos gestores tributários, garantindo consistência transacional através de protocolos ACID nas camadas de apresentação dos dados fiscais consolidados.

D

corresponde a um Data Mart departamental, uma vez que atende exclusivamente às demandas analíticas da área tributária, implementando subconjuntos especializados dos dados corporativos com modelagem otimizada para relatórios gerenciais, utilizando processos de extração incremental dos sistemas transacionais para alimentar as estruturas dimensionais específicas do domínio fiscal.

E

caracteriza um Data Lake convencional, que armazena dados em estado bruto sem aplicar transformações prévias, utilizando o método point to data para suportar volumes massivos de metadados.

Incorreta. Gabarito oficial da banca:

Salve essa questão em um caderno para revisar depois. Adicionar a um caderno

Parabéns! Você acertou!

Mantenha o ritmo! Salve no caderno para revisar depois. Adicionar a um caderno

Q3952847

Ano: 2026 Banca: FADESP Órgão: SEFAZ-PA Prova: FADESP - 2026 - SEFAZ-PA - Auditor Fiscal de Receitas Estaduais - Conhecimentos Gerais |

Q3952847 Banco de Dados

Em relação aos repositórios de dados data lake e data warehouse em arquiteturas de Big Data, analise as afirmativas a seguir.

I. Um data lake é caracterizado por priorizar a ingestão de dados em seu formato original, permitindo armazenar dados estruturados, semiestruturados e não estruturados, com uso de abordagens de schema-on-read.
II. Um data warehouse adota schema-on-write, exigindo modelagem prévia, como esquemas em estrela ou floco de neve, para suportar consultas analíticas otimizadas.
III. A simples adoção de schema-on-write em um data lake o caracteriza automaticamente como um data warehouse.

É verdadeiro o que se afirma em

A

I e II, apenas.

B

I e III, apenas.

C

II, apenas.

D

III, apenas.

E

I, II e III.

Incorreta. Gabarito oficial da banca:

Compare seu desempenho com quem faz o mesmo concurso. Ver concorrência

Parabéns! Você acertou!

Compare seu desempenho com quem faz o mesmo concurso. Ver concorrência

Q3940740

Ano: 2026 Banca: FEPESE Órgão: CIDASC Prova: FEPESE - 2026 - CIDASC - Analista de Tecnologia da Informação e Comunicação (Banco de Dados) |

Q3940740 Banco de Dados

Relacione a Coluna 1 com a Coluna 2 e assinale a alternativa que apresenta a sequência numérica correta.

Coluna 1 Ferramentas

1. Apache Spark

2. Apache Kafka

3. Power BI

Coluna 2 Descrição

( ) é um framework de computação distribuída de alta velocidade para processamento de Big Data.

( ) é uma plataforma de streaming de eventos distribuída, utilizada para construir pipelines de dados em tempo real.

( ) é uma ferramenta de Business Intelligence da Microsoft para visualização de dados e criação de dashboards interativos.

Assinale a alternativa que indica a sequência correta, de cima para baixo.

A

1 • 2 • 3

B

2 • 1 • 3

C

2 • 3 • 1

D

3 • 1 • 2

E

3 • 2 • 1

Incorreta. Gabarito oficial da banca:

Veja esse conteúdo explicado passo a passo em nossos cursos. Buscar curso

Parabéns! Você acertou!

Mandou bem! Revise esse tema nos nossos cursos. Buscar curso

Q3940727

Ano: 2026 Banca: FEPESE Órgão: CIDASC Prova: FEPESE - 2026 - CIDASC - Analista de Tecnologia da Informação e Comunicação (Banco de Dados) |

Q3940727 Banco de Dados

O conceito de Big Data refere-se a conjuntos de dados extremamente grandes e complexos. Uma arquitetura comum para lidar com Big Data é o Data Lake.

Qual a principal característica de um Data Lake?

A

Processar dados exclusivamente em tempo real (streaming).

B

Armazenar grandes volumes de dados em seu formato bruto e nativo, sem a necessidade de um esquema predefinido (schema-on-read).

C

Utilizar apenas bancos de dados NoSQL do tipo chave-valor.

D

Manter os dados distribuídos em múltiplos sistemas operacionais sem um repositório centralizado.

E

Estruturar todos os dados em um modelo relacional rigoroso antes do armazenamento (schema-on-write).

Incorreta. Gabarito oficial da banca:

Salve essa questão em um caderno para revisar depois. Adicionar a um caderno

Parabéns! Você acertou!

Mantenha o ritmo! Salve no caderno para revisar depois. Adicionar a um caderno

Q3926899

Ano: 2026 Banca: FCC Órgão: SEFAZ-SP Prova: FCC - 2026 - SEFAZ-SP - Auditor Fiscal da Receita Estadual - AFRE - Tecnologia da Informação e Comunicação - Conhecimentos Especificos (P3) |

Q3926899 Banco de Dados

Uma equipe de auditoria possui uma tabela de NF-e com mais de 1 bilhão de registros em um pyspark.sgl.DataFrame chamado df. A auditora deseja inspecionar apenas 1.000 registros localmente em seu notebook, usando funcionalidades avangadas de pandas para buscar inconsisténcias. Nesse cenário, a abordagem em PySpark mais apropriada para gerar esses registros em um pandas. DataFrame, minimizando o risco de estouro de memória no ambiente local é:

A

pdf = df.toPandas ()

pdf_sample = pdf.sample (n=1000, random_state=42)

B

sample df = df.sample(False, 0.001, seed=42)

pdf_sample = sample_df.toPandas()

C

pdf_sample = df.limit (1000).toPandas ()

D

rows = df.collect()

pdf_sample = pd.DataFrame (rows[:1000])

E

pdf_sample = spark.createDataFrame (df.head (1000)).toPandas ()

Incorreta. Gabarito oficial da banca:

Errou um tema comum da banca? Veja o que mais costuma cair no Raio-X. Ver raio-X

Parabéns! Você acertou!

Essa questão segue o padrão da banca! Veja o que mais costuma cair. Ver raio-X

Q3926893

Ano: 2026 Banca: FCC Órgão: SEFAZ-SP Prova: FCC - 2026 - SEFAZ-SP - Auditor Fiscal da Receita Estadual - AFRE - Tecnologia da Informação e Comunicação - Conhecimentos Especificos (P3) |

Q3926893 Banco de Dados

Uma Secretaria da Fazenda projeta um Data Lake para suportar fiscalização eletrônica, com ingestão diária de notas fiscais eletrônicas, conhecimentos eletrônicos de transporte de cargas, registros fiscais digitais entregues ao fisco, declarações do SIMPLES Nacional e recolhimentos. A equipe adota uma arquitetura em zonas (raw/bronze, refined/silver, curated/gold), com processos de ELT. Para o uso por auditores fiscais e cientistas de dados, a descrição mais adequada é que a zona raw/bronze

A

recebe apenas dados já deduplicados; a refined/silver armazena somente dados de terceiros; e a curated/gold contém exclusivamente dados operacionais de sistemas OLTP otimizadas para Bl e análises avançadas.

B

contém apenas dados agregados histéricos; a refined/silver guarda somente dados em tempo real; e a curated/gold armazena principalmente logs de auditoria de acesso.

C

é usada apenas para dados não estruturados; a refined/silver apenas para dados estruturados; e a curated/gold apenas para dados semiestruturados.

D

é onde os auditores executam as consultas finais; a refined/silver é usada somente por times de infraestrutura; e a curated/gold funciona basicamente como área de backup de longo prazo.

E

armazena dados brutos conforme recebidos; a refined/silver aplica padronizacao, enriquecimento e regras básicas de qualidade; a curated/gold disponibiliza modelos dimensionais ou views otimizadas para Bl e análises avançadas.

Incorreta. Gabarito oficial da banca:

Treine mais com um simulado focado no seu concurso. Criar simulado

Parabéns! Você acertou!

Está mandando bem! Treine mais em um simulado completo. Criar simulado

Q3907818

Ano: 2026 Banca: Instituto Access Órgão: Prefeitura de Contagem - MG Prova: Instituto Access - 2026 - Prefeitura de Contagem - MG - Analista de Sistemas |

Q3907818 Banco de Dados

O Data Lakehouse integra governança, desempenho analítico e flexibilidade de dados brutos, combinando controle transacional com processamento escalável em um único ambiente; assinale a alternativa correta.

A

O Data Lakehouse funciona exclusivamente como armazém histórico agregado, incompatível com dados não estruturados, aprendizado de máquina e cargas analíticas escaláveis distribuídas modernas corporativas.

B

O Data Lakehouse dispensa consistência e isolamento transacional, priorizando apenas armazenamento barato, sem mecanismos de governança, versionamento ou confiabilidade operacional analítica escalável integrada empresarial.

C

O Data Lakehouse combina governança e controle transacional com flexibilidade e escalabilidade, permitindo análises avançadas sobre dados estruturados e não estruturados em ambiente unificado.

D

O Data Lakehouse elimina esquemas e governança, operando apenas com dados brutos desestruturados, sem suporte a transações, catálogos ou processamento analítico consistente avançado moderno.

Incorreta. Gabarito oficial da banca:

Treine mais com um simulado focado no seu concurso. Criar simulado

Parabéns! Você acertou!

Está mandando bem! Treine mais em um simulado completo. Criar simulado

Q3869749

Ano: 2026 Banca: FGV Órgão: TJ-RJ Prova: FGV - 2026 - TJ-RJ - Analista Judiciário - Tecnologia da Informação - Cientista de Dados |

Q3869749 Banco de Dados

Diferentes sistemas produzem dados em formatos variados, que podem ser classificados em dados estruturados, semiestruturados ou não estruturados.
Nesse contexto, relacione os tipos de dados às suas respectivas descrições.
1. Dados estruturados
2. Dados semiestruturados
3. Dados não estruturados
( ) Gravações em áudio e vídeo de audiências públicas, armazenadas em arquivos MP4, acompanhadas apenas de nome do arquivo e data de criação.
( ) Registros de protocolo eletrônico armazenados em tabelas de banco de dados relacional, com campos bem definidos (número do processo, data, unidade, assunto) e chaves primárias/estrangeiras.
( ) Arquivos de log de acesso ao portal de serviços do governo, registrados em formato JSON, contendo campos como timestamp, user_id, endpoint, status_code, com alguns campos opcionais variando conforme o tipo de requisição.
A sequência correta é:

A

1, 2 e 3;

B

1, 3 e 2;

C

2, 1 e 3;

D

3, 1 e 2;

E

3, 2 e 1.

Incorreta. Gabarito oficial da banca:

Esse erro também aparece no seu Resumão. Veja o que melhorar

Parabéns! Você acertou!

Esse acerto está no seu Resumão. Ver Resumão da semana

Q3869738

Ano: 2026 Banca: FGV Órgão: TJ-RJ Prova: FGV - 2026 - TJ-RJ - Analista Judiciário - Tecnologia da Informação - Cientista de Dados |

Q3869738 Banco de Dados

Uma corporação multinacional do setor de varejo está unificando suas plataformas de dados. O cenário atual apresenta dois desafios distintos, indicados a seguir.
• Transacional e BI: o sistema de vendas gera registros financeiros que exigem consistência estrita (ACID). A equipe de analistas de negócios consome esses dados via painéis de BI que demandam baixa latência em consultas complexas com múltiplas junções (joins).
• Big Data e IA: o sistema de e-commerce gera petabytes de logs de navegação (clickstream) e dados de sensores IoT das lojas físicas (dados semiestruturados). A equipe de ciência de dados precisa acessar esses dados em seu formato bruto para treinar modelos preditivos, sem a perda de informações causada por agregações prematuras.
O arquiteto de dados precisa propor uma solução única que evite a duplicação de dados entre silos (um Data Warehouse para o BI e um Data Lake para a IA) e reduza o custo de armazenamento, mantendo a governança.
Considerando os requisitos apresentados e as características das arquiteturas modernas de dados, a abordagem arquitetural e de modelagem adequada é:

A

implementar um Data Warehouse Enterprise (EDW) baseado em banco de dados relacional com modelagem normalizada (3FN) para todos os dados, garantindo a integridade referencial tanto das vendas quanto dos logs, visto que a normalização é a única forma de garantir consistência ACID em escala de petabytes;

B

adotar uma arquitetura Data Lake pura (baseada em Hadoop/HDFS ou Object Storage), utilizando a abordagem Schema-on-Read para todos os consumidores; isso atenderá à equipe de ciência de dados, e a equipe de BI deverá adaptar suas ferramentas para realizar as agregações e junções em tempo de execução, aceitando a latência inerente à varredura de arquivos brutos;

C

manter a separação física, construindo um Data Mart dimensional para cada departamento dentro de um banco relacional proprietário e utilizando ferramentas de federação de dados (Data Virtualization) para que a equipe de ciência de dados consulte o Data Mart em tempo real, evitando assim a construção de um Data Lake e garantindo que o modelo de dados seja sempre Schema-on-Write;

D

utilizar um banco de dados NoSQL orientado a documentos (como MongoDB) para centralizar tanto as vendas quanto os logs, aproveitando a flexibilidade do esquema (schemaless) para ingerir dados heterogêneos rapidamente, e resolver a necessidade de BI através de processos de desnormalização extrema, armazenando todos os dados relacionados em um único documento aninhado para evitar joins;

E

implementar uma arquitetura Lakehouse, utilizando formatos de tabela abertos (como Delta Lake ou Apache Iceberg) sobre o armazenamento de objetos; isso permite aplicar transações ACID e Schema Enforcement nos dados de vendas, enquanto se adota uma modelagem dimensional (esquema estrela) na camada "Gold" para performance de BI, mantendo os dados brutos (camada "Bronze") acessíveis para Machine Learning.

Incorreta. Gabarito oficial da banca:

Treine mais com um simulado focado no seu concurso. Criar simulado

Parabéns! Você acertou!

Está mandando bem! Treine mais em um simulado completo. Criar simulado

Q3866609

Ano: 2026 Banca: Instituto Access Órgão: UNIPAMPA Prova: Instituto Access - 2026 - UNIPAMPA - Analista de Tecnologia da Informação |

Q3866609 Banco de Dados

Em iniciativas de Business Intelligence que coexistem com ambientes de Big Data, é comum a adoção de arquiteturas híbridas, nas quais datamarts tradicionais convivem com plataformas analíticas distribuídas. Considerando a modelagem de datamarts, os processos de ETL e os conceitos de Big Data e Analytics, assinale a alternativa que apresenta a afirmativa correta:

A

Conceitos de Big Data prescindem de modelagem lógica ou semântica, já que o volume e a variedade dos dados tornam inviável qualquer forma de estruturação voltada à análise.

B

Processos de ETL em ambientes de Big Data tendem a ser substituídos integralmente por abordagens de carga direta, uma vez que a escalabilidade das plataformas distribuídas elimina a necessidade de tratamento prévio dos dados.

C

A modelagem de datamarts e o uso de técnicas de Analytics avançado são mutuamente excludentes, pois datamarts priorizam relatórios históricos, enquanto Big Data se restringe exclusivamente a análises em tempo real.

D

Em projetos de BI, datamarts são geralmente modelados de forma dimensional para facilitar análises orientadas a negócio, enquanto dados oriundos de ambientes Big Data costumam passar por processos de transformação seletiva antes de serem integrados a estruturas analíticas consolidadas.

Incorreta. Gabarito oficial da banca:

Treine mais com um simulado focado no seu concurso. Criar simulado

Parabéns! Você acertou!

Está mandando bem! Treine mais em um simulado completo. Criar simulado

Q3856610

Ano: 2026 Banca: CESPE / CEBRASPE Órgão: TCE-MG Prova: CESPE / CEBRASPE - 2026 - TCE-MG - Analista de Controle Externo - Especialidade: Ciência da Computação |

Q3856610 Banco de Dados

Os data lakes

A

aplicam schema-on-read.

B

têm necessidade de normalização prévia.

C

exportam apenas relatórios padronizados obrigatórios.

D

suportam apenas SQL estruturado.

E

são exclusivos para OLTP.

Incorreta. Gabarito oficial da banca:

Esse erro também aparece no seu Resumão. Veja o que melhorar

Parabéns! Você acertou!

Esse acerto está no seu Resumão. Ver Resumão da semana

Q3851686

Ano: 2026 Banca: FGV Órgão: AMAZUL Prova: FGV - 2026 - AMAZUL - Analista de Negócios |

Q3851686 Banco de Dados

A análise de dados passou a ser aplicada em diversos setores, originando vocabulários e práticas específicas conforme o domínio analisado. Essa diversificação ocorre porque, embora muitas técnicas sejam comuns, cada área possui características próprias que influenciam coleta, processamento e aplicação dos dados.

Considerando essas aplicações verticais, assinale a opção que apresenta um exemplo típico de domínio em que a análise de dados tem sido amplamente utilizada.

A

Jardinagem.

B

Fotografia amadora.

C

Pintura decorativa.

D

Prevenção de fraudes.

E

Restauração de objetos artesanais.

Incorreta. Gabarito oficial da banca:

Veja esse conteúdo explicado passo a passo em nossos cursos. Buscar curso

Parabéns! Você acertou!

Mandou bem! Revise esse tema nos nossos cursos. Buscar curso

Q3825656

Ano: 2026 Banca: CESPE / CEBRASPE Órgão: SEDUC-SE Prova: CESPE / CEBRASPE - 2026 - SEDUC-SE - Professor de Educação Básica - Área de Atuação: Grupo I - Ensino Fundamental e Médio - Disciplina: Informática/Computação |

Q3825656 Banco de Dados

Em big data, a característica relacionada aos diferentes formatos de informações é denominada

A

volume.

B

velocidade.

C

veracidade.

D

variedade.

E

valor.

Incorreta. Gabarito oficial da banca:

Esse erro também aparece no seu Resumão. Veja o que melhorar

Parabéns! Você acertou!

Esse acerto está no seu Resumão. Ver Resumão da semana

🚀 Mais performance?

🚀 Mais performance?

Questões de Concurso Comentadas sobre big data em banco de dados

Foram encontradas 341 questões