Uma ONG, especializada na busca por gatos desaparecidos, co...

Próximas questões
Com base no mesmo assunto
Ano: 2025 Banca: FUVEST Órgão: USP Prova: FUVEST - 2025 - USP - Analista de Sistemas |
Q3509625 Engenharia de Software
Uma ONG, especializada na busca por gatos desaparecidos, contratou uma empresa de tecnologia para desenvolver um sistema de classificação de imagens baseado em Aprendizado Profundo. O objetivo é que o sistema identifique gatos em fotos enviadas por usuários. Para isso, a empresa optou por utilizar Redes Neurais Convolucionais (CNNs), dada sua capacidade de extrair automaticamente padrões visuais hierárquicos. Durante o treinamento, os desenvolvedores perceberam que a rede estava obtendo alta acurácia no conjunto de treino, mas baixo desempenho no conjunto de teste. Além disso, ao inspecionar os mapas de ativação, notaram que a rede estava focando em características irrelevantes do fundo da imagem em vez de identificar os gatos corretamente.
E relação ao problema descrito, assinale a alternativa que apresenta a abordagem mais eficaz para aprimorar a capacidade de generalização de um modelo de aprendizado de máquina.
Alternativas

Gabarito comentado

Confira o gabarito comentado por um dos nossos professores

Alternativa Correta: C

Tema central da questão: A questão aborda generalização em modelos de Aprendizado de Máquina, com foco no uso de Redes Neurais Convolucionais (CNNs) para classificação de imagens. O problema apresentado é típico: o modelo aprende bem o conjunto de treino, mas não consegue manter o desempenho nos dados de teste, o que indica sobreajuste (overfitting).

Resumo Teórico: Em Aprendizado Profundo, o sobreajuste ocorre quando o modelo "decora" os exemplos de treino e não consegue generalizar para novas situações. Regularização (como L1 e L2) e validação cruzada são técnicas fundamentais para combater esse problema:

  • Regularização L1/L2: Adicionam penalidades aos pesos da rede, evitando valores extremos e forçando a rede a focar em padrões realmente relevantes (Goodfellow et al., Deep Learning, 2016).
  • Validação cruzada: Permite avaliar o modelo em diferentes subconjuntos de dados, auxiliando no ajuste fino dos hiperparâmetros e reduzindo a chance de overfitting.

Justificativa da alternativa C: A implementação de técnicas de regularização e o uso de validação cruzada são as práticas mais indicadas para aprimorar a generalização do modelo, evitando que ele se prenda a padrões irrelevantes, como o fundo das imagens, e sim aprenda a identificar gatos de forma robusta e confiável.

Análise das Alternativas Incorretas:

  • A: Aumentar a complexidade pode piorar o sobreajuste, pois o modelo terá ainda mais facilidade para "decorar" o treino.
  • B: Ignorar validação externa impede identificar e corrigir problemas de generalização.
  • D: Reduzir demais o conjunto de treino diminui a variedade de exemplos e prejudica o aprendizado.
  • E: Ignorar pré-processamento pode introduzir ruídos e padrões irrelevantes, prejudicando o desempenho.

Estratégia para questões similares: Procure sempre identificar sintomas de sobreajuste (alta acurácia apenas no treino) e relacione com soluções clássicas: regularização, validação cruzada, aumento de dados ou técnicas de data augmentation. Fique atento a alternativas que sugerem ignorar etapas essenciais do pipeline de IA.

Gostou do comentário? Deixe sua avaliação aqui embaixo!

Clique para visualizar este gabarito

Visualize o gabarito desta questão clicando no botão abaixo

Comentários

Veja os comentários dos nossos alunos

O problema descrito é um caso típico de sobreajuste (overfitting), em que o modelo aprende muito bem os dados de treinamento, mas não consegue generalizar para novos dados. Além disso, o fato de a rede estar focando em partes irrelevantes da imagem, como o fundo, indica que ela está capturando padrões que não são úteis para a tarefa de identificar gatos.

A regularização (como L1 ou L2) ajuda a limitar a complexidade do modelo, penalizando pesos excessivamente grandes e incentivando o aprendizado de padrões mais robustos. A validação cruzada permite avaliar o desempenho do modelo em diferentes subconjuntos dos dados, ajudando a ajustar os hiperparâmetros e a evitar o sobreajuste.

As demais alternativas estão incorretas por estes motivos:

  • A: Aumentar a complexidade do modelo pode intensificar o sobreajuste.
  • B: Treinar apenas com os dados de treino, sem validação, impede detectar problemas de generalização.
  • D: Reduzir o conjunto de dados compromete a representatividade e pode prejudicar o desempenho.
  • E: Ignorar o pré-processamento pode introduzir ruído e dificultar o aprendizado do modelo.

Sobre a letra E: “O pré-processamento de textos é uma etapa importante no processo de análise e classificação de dados textuais. Ele visa transformar textos brutos em um formato adequado para ser utilizado em algoritmos de aprendizado de máquina. Entre as técnicas mais comuns no pré-processamento de textos, estão a remoção de stop words, a tokenização, a lematização e o estemização.” (Fuvest/2025)

Gabarito: letra C.

Clique para visualizar este comentário

Visualize os comentários desta questão clicando no botão abaixo