Uma ONG, especializada na busca por gatos desaparecidos, co...
E relação ao problema descrito, assinale a alternativa que apresenta a abordagem mais eficaz para aprimorar a capacidade de generalização de um modelo de aprendizado de máquina.
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Alternativa Correta: C
Tema central da questão: A questão aborda generalização em modelos de Aprendizado de Máquina, com foco no uso de Redes Neurais Convolucionais (CNNs) para classificação de imagens. O problema apresentado é típico: o modelo aprende bem o conjunto de treino, mas não consegue manter o desempenho nos dados de teste, o que indica sobreajuste (overfitting).
Resumo Teórico: Em Aprendizado Profundo, o sobreajuste ocorre quando o modelo "decora" os exemplos de treino e não consegue generalizar para novas situações. Regularização (como L1 e L2) e validação cruzada são técnicas fundamentais para combater esse problema:
- Regularização L1/L2: Adicionam penalidades aos pesos da rede, evitando valores extremos e forçando a rede a focar em padrões realmente relevantes (Goodfellow et al., Deep Learning, 2016).
- Validação cruzada: Permite avaliar o modelo em diferentes subconjuntos de dados, auxiliando no ajuste fino dos hiperparâmetros e reduzindo a chance de overfitting.
Justificativa da alternativa C: A implementação de técnicas de regularização e o uso de validação cruzada são as práticas mais indicadas para aprimorar a generalização do modelo, evitando que ele se prenda a padrões irrelevantes, como o fundo das imagens, e sim aprenda a identificar gatos de forma robusta e confiável.
Análise das Alternativas Incorretas:
- A: Aumentar a complexidade pode piorar o sobreajuste, pois o modelo terá ainda mais facilidade para "decorar" o treino.
- B: Ignorar validação externa impede identificar e corrigir problemas de generalização.
- D: Reduzir demais o conjunto de treino diminui a variedade de exemplos e prejudica o aprendizado.
- E: Ignorar pré-processamento pode introduzir ruídos e padrões irrelevantes, prejudicando o desempenho.
Estratégia para questões similares: Procure sempre identificar sintomas de sobreajuste (alta acurácia apenas no treino) e relacione com soluções clássicas: regularização, validação cruzada, aumento de dados ou técnicas de data augmentation. Fique atento a alternativas que sugerem ignorar etapas essenciais do pipeline de IA.
Gostou do comentário? Deixe sua avaliação aqui embaixo!
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
O problema descrito é um caso típico de sobreajuste (overfitting), em que o modelo aprende muito bem os dados de treinamento, mas não consegue generalizar para novos dados. Além disso, o fato de a rede estar focando em partes irrelevantes da imagem, como o fundo, indica que ela está capturando padrões que não são úteis para a tarefa de identificar gatos.
A regularização (como L1 ou L2) ajuda a limitar a complexidade do modelo, penalizando pesos excessivamente grandes e incentivando o aprendizado de padrões mais robustos. A validação cruzada permite avaliar o desempenho do modelo em diferentes subconjuntos dos dados, ajudando a ajustar os hiperparâmetros e a evitar o sobreajuste.
As demais alternativas estão incorretas por estes motivos:
- A: Aumentar a complexidade do modelo pode intensificar o sobreajuste.
- B: Treinar apenas com os dados de treino, sem validação, impede detectar problemas de generalização.
- D: Reduzir o conjunto de dados compromete a representatividade e pode prejudicar o desempenho.
- E: Ignorar o pré-processamento pode introduzir ruído e dificultar o aprendizado do modelo.
Sobre a letra E: “O pré-processamento de textos é uma etapa importante no processo de análise e classificação de dados textuais. Ele visa transformar textos brutos em um formato adequado para ser utilizado em algoritmos de aprendizado de máquina. Entre as técnicas mais comuns no pré-processamento de textos, estão a remoção de stop words, a tokenização, a lematização e o estemização.” (Fuvest/2025)
Gabarito: letra C.
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo