Em um ambiente de Big Data, a função do HDFS (Hadoop distri...

Com base no mesmo assunto

Ano: 2025 Banca: CESPE / CEBRASPE Órgão: STM Prova: CESPE / CEBRASPE - 2025 - STM - Analista Judiciário - Área: Apoio Especializado - Especialidade: Suporte em Tecnologia da Informação |

Q3409310 Banco de Dados

Texto associado

Acerca de deep learning, de Big Data e de redes neurais, julgue o item subsequente.

Em um ambiente de Big Data, a função do HDFS (Hadoop distributed file system) é caracterizada por armazenar grandes volumes de dados de forma distribuída e tolerante a falhas.

Certo

Errado

Incorreta. Gabarito oficial da banca:

Esse erro também aparece no seu Resumão. Veja o que melhorar

teste

Parabéns! Você acertou!

Esse acerto está no seu Resumão. Ver Resumão da semana

teste

Gabarito comentado

Confira o gabarito comentado por um dos nossos professores

Alternativa correta: C – certo

Tema central: A questão trata do papel do HDFS (Hadoop Distributed File System) em ambientes de Big Data. O entendimento deste conceito é essencial para concursos que cobram fundamentos de bancos de dados e infraestrutura para processamento de grandes volumes de dados.

Resumo teórico: O HDFS é o sistema de arquivos distribuído do ecossistema Hadoop. Ele foi projetado para armazenar grandes volumes de dados, dividindo arquivos em blocos distribuídos por vários servidores (nós), garantindo tolerância a falhas por meio de replicação automática dos dados. Se um nó falhar, os dados continuam acessíveis através das cópias mantidas em outros nós.

Fontes relevantes: Manual do Apache Hadoop, documentação oficial do HDFS (HDFS Design), e livros como "Hadoop: The Definitive Guide" de Tom White.

Justificativa da alternativa correta: A afirmação está correta porque o HDFS é realmente responsável por armazenar grandes volumes de dados de forma distribuída e tolerante a falhas. Isso é feito pela divisão dos dados em blocos e sua replicação em diferentes máquinas do cluster, proporcionando alta disponibilidade e resiliência a falhas de hardware.

Estratégia de interpretação: Em questões assim, fique atento a termos técnicos como “distribuído” e “tolerante a falhas”, essenciais para diferenciar o HDFS de outros sistemas de arquivos comuns. Pegadinhas costumam aparecer quando se confunde HDFS com bancos de dados relacionais ou sistemas de arquivos locais, que não têm essas características.

Dica final: Sempre relacione os conceitos mencionados na questão ao contexto de Big Data e busque palavras-chave que confirmem funcionalidades específicas, como tolerância a falhas e armazenamento distribuído.

Gostou do comentário? Deixe sua avaliação aqui embaixo!

Clique para visualizar este gabarito

Visualize o gabarito desta questão clicando no botão abaixo

Comentários

Veja os comentários dos nossos alunos

certo

HDFS tem processamento paralelo e distribuído

faz escalabilidade horizontal, que a grosso modo é adicionar mais máquinas, o que o torna tolerante a falhas

se eu tenho 4 computadores

PC1-PC2-PC3-PC4

e eu adiciono mais um

PC1-PC2-PC3-PC4-PC5

eu estou fazendo escalabilidade horizontal

Certo.

A afirmação descreve com exatidão a função principal do HDFS (Hadoop Distributed File System). Ele é a camada de armazenamento do ecossistema Hadoop, projetado especificamente para gerenciar arquivos muito grandes, dividindo-os em blocos que são distribuídos por múltiplos nós em um cluster. A tolerância a falhas é uma característica central, garantida pela replicação de cada bloco em diferentes máquinas.

Siga-me no @rexconcurseiro

O que é MapReduce? MapReduce é um modelo ou padrão de programação dentro do framework Hadoop usado para acessar big data armazenado no Sistema de Arquivos Hadoop (HDFS). É um componente central, essencial ao funcionamento do framework Hadoop.

O HDFS é usado para gerenciar aplicativos que lidam com enormes conjuntos de dados. Para fazer isso, o HDFS deve ter centenas de nós por cluster. Detecção de falhas: como o HDFS inclui uma grande quantidade de hardware comum, ele deve ter técnicas para verificar e detectar falhas de forma rápida e eficaz.

Em suma:

HDFS gerencia big data de maneira eficiente com alta taxa de transferência, o HDFS pode ser usado como um e é ideal para compatibilidade com complexa.

A afirmativa está Certa.

Explicação:

O HDFS (Hadoop Distributed File System) é um sistema de arquivos distribuído usado em ambientes de Big Data. Sua função principal é armazenar grandes volumes de dados de forma distribuída entre vários nós (servidores), garantindo alta disponibilidade e tolerância a falhas. Para isso, ele replica os dados em diferentes nós, de modo que, se algum nó falhar, os dados ainda estarão disponíveis em outros nós.

Assim, o HDFS é essencial para o processamento de Big Data, pois possibilita a escalabilidade e confiabilidade no armazenamento dos dados em larga escala.

O HDFS é extremamente escalável e tolerante a falhas. Ele é projetado para processar de forma

eficiente de forma paralela em ambiente distribuído no mesmo hardware simples (commodity).

HDFS tem processos daemon em Hadoop, que gerenciam os dados. Os processos são NameNode,

DataNode, BackupNode, e Checkpoint NameNode.

Clique para visualizar este comentário

Visualize os comentários desta questão clicando no botão abaixo

Resumos relacionados

Resumo

SGBD: Conceitos Fundamentais e Aplicações em Concursos Públicos

O Sistema de Gerenciamento de Banco de Dados (SGBD) é uma peça fundamental na disciplina de Banco de Dados, sendo frequentemente abordado em concursos públicos de níveis médio e superior. Ele consiste em um conjunto de softwares responsáveis por gerenciar, armazenar, recuperar e manipular dados em um banco de dados, garantindo segurança, integridade e eficiência no acesso à informação.

🚀 Mais performance?