O Apache Hadoop é um framework de código aberto usado para ...
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
O tema central da questão é o Apache Hadoop, que é um framework de código aberto utilizado para armazenar e processar grandes conjuntos de dados de forma eficiente. Para responder corretamente a esta questão, é necessário ter um entendimento básico sobre os componentes principais do Hadoop, especialmente os módulos YARN e MapReduce.
O Apache Hadoop é constituído por quatro módulos principais: HDFS (Hadoop Distributed File System), YARN (Yet Another Resource Negotiator), MapReduce e Hadoop Common.
A alternativa D é a correta: plataforma de gerenciamento de clusters e processamento paralelo/distribuído.
Justificativa:
- YARN é um componente de gerenciamento de recursos que permite a administração de clusters de computadores. Portanto, ele é uma plataforma de gerenciamento de clusters.
- MapReduce é um modelo de programação utilizado para o processamento paralelo de grandes volumes de dados distribuídos. Assim, ele é responsável pelo processamento paralelo/distribuído.
Análise das alternativas incorretas:
- A - Esta alternativa menciona um "sistema otimizado para transferência de dados", mas o YARN não é responsável pela transferência de dados, e sim pelo gerenciamento de recursos. O MapReduce, por sua vez, não é uma "plataforma de gerenciamento de recursos".
- B - A alternativa sugere que o YARN é um "sistema de arquivos distribuídos", o que está incorreto, pois essa é a função do HDFS, não do YARN. Além disso, o MapReduce não é uma "plataforma de gerenciamento de clusters".
- C - Aqui, o MapReduce é corretamente identificado como um "modelo de computação paralela", mas a associação de YARN a um "sistema de arquivos distribuídos" está incorreta, pois isso é função do HDFS.
Em resumo, entender o papel específico de cada módulo do Apache Hadoop é essencial para escolher a alternativa correta. O YARN gerencia recursos e o MapReduce processa dados de forma paralela e distribuída.
Gostou do comentário? Deixe sua avaliação aqui embaixo!
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
D) Plataforma de gerenciamento de clusters e processamento paralelo/distribuído.
- ✔️ YARN: É o gerenciador de recursos do Hadoop, responsável por alocar CPU, memória e outros recursos nos nós do cluster.
- ✔️ MapReduce: É o modelo de processamento paralelo e distribuído, dividindo tarefas em estágios de Map e Reduce.
A) Sistema otimizado para transferência de dados e plataforma de gerenciamento de recursos.
- ❌ YARN não é um sistema de transferência de dados (isso seria mais relacionado ao HDFS ou ferramentas como Apache Kafka).
- ❌ MapReduce não gerencia recursos (quem faz isso é o YARN).
B) Sistema de arquivos distribuídos e plataforma de gerenciamento de clusters.
- ❌ Sistema de arquivos distribuídos é o HDFS, não o YARN.
- ❌ MapReduce não gerencia clusters (sua função é processamento de dados).
C) Modelo de computação paralela e sistema de arquivos distribuídos.
- ❌ MapReduce é de fato um modelo de computação paralela (parte correta), mas YARN não é um sistema de arquivos (o HDFS é).
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo