Questões de Concurso
Sobre banco de dados paralelos e distribuídos em banco de dados
Foram encontradas 245 questões
De acordo com o Teorema CAP, esse sistema prioriza as propriedades de
O Portal da Transparência do Governo Federal precisa lidar com um volume massivo e crescente de dados heterogêneos, como despesas, receitas, contratos e informações sobre servidores. A arquitetura de dados atual, baseada em um modelo puramente relacional, enfrenta desafios de desempenho e flexibilidade para incorporar novas fontes de dados.
Analise as seguintes proposições sobre a aplicação de bancos de dados NoSQL para solucionar os desafios do Portal da Transparência:
I. Bancos de dados relacionais são inerentemente superiores aos NoSQL para cenários de Big Data e dados heterogêneos, pois a rigidez do esquema e o suporte a transações ACID garantem melhor desempenho em consultas analíticas complexas.
II. A adoção de um banco de dados NoSQL orientado a documentos permitiria armazenar os dados de cada fonte (despesas, contratos, etc.) em seus formatos originais (JSON, por exemplo), facilitando a ingestão e a evolução do modelo de dados sem a necessidade de migrações de esquema complexas.
III. A escalabilidade horizontal, uma característica comum em muitos SGBDs NoSQL, seria um benefício chave, permitindo que a infraestrutura do portal cresça de forma mais elástica e com menor custo para acompanhar o aumento do volume de dados e do número de acessos.
Está correto o que se afirma em:
Para lidar com o grande volume e a complexidade dos dados do Big Data, foram desenvolvidas tecnologias e frameworks específicos, que superam as limitações dos sistemas de bancos de dados tradicionais. Um analista de dados de um órgão de pesquisa precisa processar um grande conjunto de dados não estruturados.
Analise as seguintes proposições sobre as tecnologias de Big Data:
I. O Hadoop é um framework de código aberto que permite o processamento distribuído de grandes conjuntos de dados em clusters de computadores. Seus componentes principais são o HDFS (Hadoop Distributed File System), para armazenamento distribuído, e o MapReduce, para o processamento paralelo.
II. O MapReduce é um modelo de programação onde a tarefa é dividida em duas fases: a fase 'Map', que processa e mapeia os dados de entrada em pares de chave-valor, e a fase 'Reduce', que agrega os resultados intermediários da fase 'Map' para produzir o resultado final.
III. O Spark é outro framework de processamento distribuído que, embora compatível com o ecossistema Hadoop, é conhecido por ser significativamente mais rápido, pois realiza o processamento em memória (in-memory), sendo ideal para aplicações de aprendizado de máquina e processamento de dados em tempo real.
Está correto o que se afirma em:
Julgue o item a seguir, relacionados à integração de Big Data e inteligência artificial, bem como a ferramentas de migração.
Sistemas de inteligência artificial executados em infraestrutura de nuvem prescindem da utilização de armazenamento distribuído, pois os modelos de IA processam dados diretamente na memória dos nós de processamento sem necessidade de acesso a dados persistidos.
Julgue o item a seguir, relacionados à integração de Big Data e inteligência artificial, bem como a ferramentas de migração.
Plataformas de processamento distribuído utilizadas em ambientes de Big Data podem ser executadas em infraestrutura de nuvem para realizar processamento paralelo de grandes volumes de dados, os quais podem posteriormente ser utilizados no treinamento de modelos de inteligência artificial.
A alta disponibilidade de bancos de dados pode ser alcançada através de técnicas de clusterização e replicação.
Qual a principal diferença entre clusterização e replicação?
Nesse contexto, assinale a alternativa que identifica o processo de particionamento de um banco de dados ou conjunto de dados em partes menores e gerenciáveis, passíveis de serem distribuídas e armazenadas em diferentes nós de um cluster ou sistema distribuído.
Assinale a opção que descreve corretamente o fluxo de comunicação entre o Coordenador e os Participantes durante a primeira fase do protocolo 2PC.