Questões de Concurso Sobre banco de dados paralelos e distribuídos em banco de dados

Foram encontradas 245 questões

Q4091006 Banco de Dados
Um arquiteto de sistemas de uma instituição financeira gerencia um ambiente de banco de dados distribuído que opera com o protocolo de efetivação em duas fases (2PC) para garantir a consistência ACID. Em um cenário de auditoria, uma transação T1 envolve o débito na conta de um cliente no servidor X e o crédito na conta de uma loja no servidor Y. Durante a execução, o coordenador da transação emite a ordem de preparação e tanto o servidor X quanto o servidor Y respondem afirmativamente (Vote Commit), entrando no estado de prontidão. Imediatamente após receber os votos, o coordenador toma a decisão de efetivar a transação e grava o registro Commit em seu armazenamento estável, mas falha criticamente antes de conseguir transmitir a mensagem de decisão para qualquer um dos servidores participantes. Diante desse cenário de falha do coordenador após o voto de prontidão dos participantes, qual é o comportamento técnico obrigatório do servidor Y? 
Alternativas
Q4088619 Banco de Dados
O Auditor fiscaliza a arquitetura de um novo banco de dados NoSQL distribuído para o TCE-SC. O sistema precisa garantir que, em caso de falha na rede entre dois data centers, o sistema continue aceitando gravações, mesmo que os dados fiquem temporariamente inconsistentes entre os nós.
De acordo com o Teorema CAP, esse sistema prioriza as propriedades de
Alternativas
Ano: 2026 Banca: FURB Órgão: SED-SC Prova: FURB - 2026 - SED-SC - Analista de Informática |
Q4080372 Banco de Dados
Em bancos de dados distribuídos, o Sharding é utilizado para distribuir dados entre múltiplos nós, visando escalabilidade horizontal e melhor desempenho. A respeito do Sharding, assinale a alternativa correta: 
Alternativas
Ano: 2026 Banca: FURB Órgão: SED-SC Prova: FURB - 2026 - SED-SC - Analista de Informática |
Q4080371 Banco de Dados
Em sistemas distribuídos que executam transações envolvendo múltiplos nós, a garantia de atomicidade é frequentemente obtida por meio do protocolo Two-Phase Commit, no qual um coordenador interage com participantes por meio de duas fases distintas: prepare (voting) e commit/abort. O protocolo assume comunicação confiável e utiliza registros persistentes (logs) para permitir recuperação após falhas, mantendo consistência entre os participantes. Considerando as propriedades formais do protocolo 2PC, assinale a alternativa correta: 
Alternativas
Q4048568 Banco de Dados

O Portal da Transparência do Governo Federal precisa lidar com um volume massivo e crescente de dados heterogêneos, como despesas, receitas, contratos e informações sobre servidores. A arquitetura de dados atual, baseada em um modelo puramente relacional, enfrenta desafios de desempenho e flexibilidade para incorporar novas fontes de dados.


Analise as seguintes proposições sobre a aplicação de bancos de dados NoSQL para solucionar os desafios do Portal da Transparência: 


I. Bancos de dados relacionais são inerentemente superiores aos NoSQL para cenários de Big Data e dados heterogêneos, pois a rigidez do esquema e o suporte a transações ACID garantem melhor desempenho em consultas analíticas complexas.


 II. A adoção de um banco de dados NoSQL orientado a documentos permitiria armazenar os dados de cada fonte (despesas, contratos, etc.) em seus formatos originais (JSON, por exemplo), facilitando a ingestão e a evolução do modelo de dados sem a necessidade de migrações de esquema complexas.


III. A escalabilidade horizontal, uma característica comum em muitos SGBDs NoSQL, seria um benefício chave, permitindo que a infraestrutura do portal cresça de forma mais elástica e com menor custo para acompanhar o aumento do volume de dados e do número de acessos.


Está correto o que se afirma em:

Alternativas
Q4048561 Banco de Dados

Para lidar com o grande volume e a complexidade dos dados do Big Data, foram desenvolvidas tecnologias e frameworks específicos, que superam as limitações dos sistemas de bancos de dados tradicionais. Um analista de dados de um órgão de pesquisa precisa processar um grande conjunto de dados não estruturados.


Analise as seguintes proposições sobre as tecnologias de Big Data:


I. O Hadoop é um framework de código aberto que permite o processamento distribuído de grandes conjuntos de dados em clusters de computadores. Seus componentes principais são o HDFS (Hadoop Distributed File System), para armazenamento distribuído, e o MapReduce, para o processamento paralelo.

II. O MapReduce é um modelo de programação onde a tarefa é dividida em duas fases: a fase 'Map', que processa e mapeia os dados de entrada em pares de chave-valor, e a fase 'Reduce', que agrega os resultados intermediários da fase 'Map' para produzir o resultado final.

III. O Spark é outro framework de processamento distribuído que, embora compatível com o ecossistema Hadoop, é conhecido por ser significativamente mais rápido, pois realiza o processamento em memória (in-memory), sendo ideal para aplicações de aprendizado de máquina e processamento de dados em tempo real.


Está correto o que se afirma em: 

Alternativas
Q4036220 Banco de Dados
Um Analista de Sistemas, que atua em uma agência de fomento vinculada ao setor governamental, está trabalhando com o Hadoop para processar e analisar grandes volumes de dados armazenados no HDFS (Hadoop Distributed File System). Ele precisa consultar esses dados de forma rápida e eficiente, utilizando uma linguagem semelhante ao SQL (Structured Query Language) para extrair informações agregadas e gerar relatórios. Considerando esse contexto, assinale a alternativa que apresenta duas ferramentas do Hadoop capazes de consultar grandes volumes de dados no HDFS, usando uma linguagem semelhante ao SQL (HiveQL/SQL):
Alternativas
Q4027777 Banco de Dados

Julgue o item a seguir, relacionados à integração de Big Data e inteligência artificial, bem como a ferramentas de migração. 


Sistemas de inteligência artificial executados em infraestrutura de nuvem prescindem da utilização de armazenamento distribuído, pois os modelos de IA processam dados diretamente na memória dos nós de processamento sem necessidade de acesso a dados persistidos.

Alternativas
Q4027776 Banco de Dados

Julgue o item a seguir, relacionados à integração de Big Data e inteligência artificial, bem como a ferramentas de migração. 


Plataformas de processamento distribuído utilizadas em ambientes de Big Data podem ser executadas em infraestrutura de nuvem para realizar processamento paralelo de grandes volumes de dados, os quais podem posteriormente ser utilizados no treinamento de modelos de inteligência artificial. 

Alternativas
Q4014178 Banco de Dados
Julgue o próximo item, relativo aos dados estruturados e não estruturados, à ingestão e armazenamento de grande quantidade de dados e aos bancos de dados NoSQL.
Bancos de dados NoSQL são projetados para garantir, por padrão, consistência forte (strong consistency), priorizando a integridade imediata dos dados em ambientes distribuídos. 
Alternativas
Q3973796 Banco de Dados
No contexto de bancos de dados NoSQL distribuídos, existem princípios que orientam decisões arquiteturais relacionadas a consistência, disponibilidade e tolerância a particionamento, bem como seus impactos na modelagem e no acesso aos dados. Assinale a opção que indica corretamente um conceito associado a esses bancos de dados.
Alternativas
Q3961429 Banco de Dados
Assinale a opção que corresponde ao modelo, em Big Data, utilizado para processar paralelamente grandes volumes de dados.
Alternativas
Q3956762 Banco de Dados
Um sistema estadual de arrecadação consolida diariamente indicadores tributários provenientes de múltiplas fontes e, para acelerar leituras repetitivas desses indicadores já consolidados, a equipe de Dados está avaliando armazená-los em um banco NoSQL do tipo chave-valor. Considerando as características desse modelo de dados, a justificativa que melhor fundamenta essa escolha é:
Alternativas
Q3940733 Banco de Dados

A alta disponibilidade de bancos de dados pode ser alcançada através de técnicas de clusterização e replicação.



Qual a principal diferença entre clusterização e replicação?

Alternativas
Q3926899 Banco de Dados
Uma equipe de auditoria possui uma tabela de NF-e com mais de 1 bilhão de registros em um pyspark.sgl.DataFrame chamado df. A auditora deseja inspecionar apenas 1.000 registros localmente em seu notebook, usando funcionalidades avangadas de pandas para buscar inconsisténcias. Nesse cenário, a abordagem em PySpark mais apropriada para gerar esses registros em um pandas. DataFrame, minimizando o risco de estouro de memória no ambiente local é: 
Alternativas
Q3922581 Banco de Dados
O MongoDB é um banco de dados NoSQL amplamente utilizado em sistemas distribuídos, oferecendo mecanismos próprios para escalabilidade e alta disponibilidade. Sobre MongoDB, assinale a alternativa correta. 
Alternativas
Q3885746 Banco de Dados
Um banco de dados da Assembleia, responsável pelo armazenamento de informações legislativas, apresentou crescimento significativo, tornando inviável sua administração e processamento em um único servidor. Para aprimorar o desempenho das consultas e a escalabilidade do sistema, tornou-se necessária a distribuição dos dados entre múltiplos servidores independentes.
Nesse contexto, assinale a alternativa que identifica o processo de particionamento de um banco de dados ou conjunto de dados em partes menores e gerenciáveis, passíveis de serem distribuídas e armazenadas em diferentes nós de um cluster ou sistema distribuído. 
Alternativas
Q3885596 Banco de Dados
Uma empresa de e-commerce utiliza um sistema de banco de dados distribuído para gerenciar seu inventário e as informações financeiras. Para garantir a atomicidade de transações críticas como a compra de um produto que envolve a baixa no inventário em um nó e o débito na conta em outro nó, o SGBD utiliza o protocolo Two-Phase Commit.
Assinale a opção que descreve corretamente o fluxo de comunicação entre o Coordenador e os Participantes durante a primeira fase do protocolo 2PC.
Alternativas
Q3878709 Banco de Dados
Mateus trabalha em uma multinacional de tecnologia e está desenvolvendo uma nova rede social de uso exclusivo da empresa. A nova rede social lidará com um grande volume de dados dinâmicos como postagens, curtidas e comentários por minuto. O desafio de Mateus é manter a alta disponibilidade para conteúdos recentes e reduzir os custos de armazenamento com os dados antigos em virtude de serem menos acessados. A estratégia utilizada por Mateus para garantir essas premissas é a replicação:
Alternativas
Q3878686 Banco de Dados
Considerando as demandas típicas de um tribunal por sistemas confiáveis e previsíveis, e à luz do teorema CAP, um banco de dados distribuído que prioriza consistência e tolerância a partições (CP), sacrificando temporariamente a disponibilidade durante partições de rede, é a escolha mais adequada para um:
Alternativas
Respostas
1: B
2: C
3: A
4: E
5: D
6: C
7: A
8: E
9: C
10: E
11: A
12: C
13: A
14: A
15: C
16: B
17: D
18: B
19: A
20: E