Uma Analista de uma Secretaria da Fazenda está esclarecendo ...
Comentários
Veja os comentários dos nossos alunos
O gabarito está correto?
O Hadoop é um framework para armazenar e processar grandes quantidades de dados rapidamente.
Sendo assim, não entendo como a letra A pode ser um dos principais benefícios da ferramenta.
Na minha visão, o Hadoop estaria mais relacionado a letra B ou C.
- Analisar grandes volumes de dados fiscais e transacionais, vindos de diferentes fontes (NF-e, SPED, PGDAS, etc.)
- Identificar padrões incomuns e anomalias, auxiliando na detecção de fraudes, sonegação e evasão fiscal
- Agilizar auditorias e cruzamentos complexos, algo impraticável com ferramentas tradicionais
- B) Redução do tempo de coleta de dados: Hadoop processa e analisa dados, não coleta.
- C) Redução de custos e latência paralela: Embora use processamento paralelo, o foco aqui não é custo e latência.
- D) Melhoria na precisão das previsões fiscais: Isso está mais relacionado a modelos estatísticos ou de machine learning, não diretamente ao Hadoop.
- E) Aumento da segurança dos dados: Hadoop tem recursos, mas não é conhecido primariamente por segurança.
GPT
A Secretaria da Fazenda lida com grandes volumes de dados fiscais — como notas fiscais eletrônicas, declarações de impostos, movimentações financeiras, entre outros. O Hadoop permite que esses dados sejam processados em paralelo, em diferentes máquinas, reduzindo drasticamente o tempo de análise e possibilitando a tomada de decisões baseada em dados quase em tempo real.
- Detecção de fraudes fiscais por meio de análise de padrões.
- Monitoramento em larga escala de contribuintes.
- Integração com ferramentas como Hive e Pig, facilitando consultas e relatórios.
- Armazenamento de longo prazo e custo reduzido, utilizando HDFS.
ChatGPT
Embora o gabarito oficial da questão seja a alternativa A, esta é uma mera consequência do disposto na alternativa C, que de fato é citada em diversos conteúdos sobre o assunto como um de seus principais benefícios (baixo custo e alto desempenho). Questão era passível de recurso com alteração de gabarito.
Gab Banca: A.
Marquei a C como gabarito por conta da questão do processamento paralelo.
Dai fui olhar no GPT e ele concorda:
- A) identificação eficiente de fraudes e evasão fiscal.
- ❌ Isso é um uso possível do Hadoop (analisar dados fiscais para identificar fraudes), mas não é o benefício principal do framework.
- B) redução do tempo de coleta de dados.
- ❌ Hadoop não coleta dados — ele processa e armazena os dados massivos.
- C) redução dos custos e latência paralela.
- ✅ Correta.
- O Hadoop permite usar clusters de máquinas comuns (baixo custo) e processamento paralelo (via MapReduce), reduzindo custos e melhorando o desempenho.
- D) melhoria na precisão das previsões fiscais.
- ❌ Isso depende de técnicas analíticas (Machine Learning, estatística), não do Hadoop em si.
- E) aumento da segurança dos dados.
- ❌ Hadoop não tem como foco principal a segurança, e sim o armazenamento e processamento em larga escala.
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo