Uma ONG, especializada na busca por gatos desaparecidos,
contratou uma empresa de tecnologia para desenvolver um
sistema de classificação de imagens baseado em
Aprendizado Profundo. O objetivo é que o sistema identifique
gatos em fotos enviadas por usuários. Para isso, a empresa
optou por utilizar Redes Neurais Convolucionais (CNNs), dada
sua capacidade de extrair automaticamente padrões visuais
hierárquicos.
Durante o treinamento, os desenvolvedores perceberam que
a rede estava obtendo alta acurácia no conjunto de treino, mas
baixo desempenho no conjunto de teste. Além disso, ao
inspecionar os mapas de ativação, notaram que a rede estava
focando em características irrelevantes do fundo da imagem
em vez de identificar os gatos corretamente.
E relação ao problema descrito, assinale a alternativa que
apresenta a abordagem mais eficaz para aprimorar a
capacidade de generalização de um modelo de aprendizado
de máquina.

Question

Uma ONG, especializada na busca por gatos desaparecidos,
contratou uma empresa de tecnologia para desenvolver um
sistema de classificação de imagens baseado em
Aprendizado Profundo. O objetivo é que o sistema identifique
gatos em fotos enviadas por usuários. Para isso, a empresa
optou por utilizar Redes Neurais Convolucionais (CNNs), dada
sua capacidade de extrair automaticamente padrões visuais
hierárquicos.
Durante o treinamento, os desenvolvedores perceberam que
a rede estava obtendo alta acurácia no conjunto de treino, mas
baixo desempenho no conjunto de teste. Além disso, ao
inspecionar os mapas de ativação, notaram que a rede estava
focando em características irrelevantes do fundo da imagem
em vez de identificar os gatos corretamente.
E relação ao problema descrito, assinale a alternativa que
apresenta a abordagem mais eficaz para aprimorar a
capacidade de generalização de um modelo de aprendizado
de máquina. Alternativa A: Aumentar a complexidade do modelo, utilizando o máximo
de parâmetros possíveis, sem restrições. Ou Alternativa B: Treinar o modelo exclusivamente com os dados de
treinamento disponíveis, sem validação externa ou ajuste
fino. Ou Alternativa C: Implementar técnicas de regularização, como L1 ou L2, e
utilizar validação cruzada para avaliar o desempenho e
ajustar hiperparâmetros. Ou Alternativa D: Reduzir drasticamente o conjunto de dados de
treinamento para evitar sobreajuste, mesmo que isso
comprometa a representatividade dos dados. Ou Alternativa E: Ignorar a fase de pré-processamento de dados e utilizar os
dados brutos diretamente no treinamento do modelo.

Qconcursos · Accepted Answer

Alternativa [C] Implementar técnicas de regularização, como L1 ou L2, e
utilizar validação cruzada para avaliar o desempenho e
ajustar hiperparâmetros. Alternativa Correta: C

Tema central da questão: A questão aborda generalização em modelos de Aprendizado de Máquina, com foco no uso de Redes Neurais Convolucionais (CNNs) para classificação de imagens. O problema apresentado é típico: o modelo aprende bem o conjunto de treino, mas não consegue manter o desempenho nos dados de teste, o que indica sobreajuste (overfitting).

Resumo Teórico: Em Aprendizado Profundo, o sobreajuste ocorre quando o modelo "decora" os exemplos de treino e não consegue generalizar para novas situações. Regularização (como L1 e L2) e validação cruzada são técnicas fundamentais para combater esse problema:

Regularização L1/L2: Adicionam penalidades aos pesos da rede, evitando valores extremos e forçando a rede a focar em padrões realmente relevantes (Goodfellow et al., Deep Learning, 2016).
  Validação cruzada: Permite avaliar o modelo em diferentes subconjuntos de dados, auxiliando no ajuste fino dos hiperparâmetros e reduzindo a chance de overfitting.

Justificativa da alternativa C: A implementação de técnicas de regularização e o uso de validação cruzada são as práticas mais indicadas para aprimorar a generalização do modelo, evitando que ele se prenda a padrões irrelevantes, como o fundo das imagens, e sim aprenda a identificar gatos de forma robusta e confiável.

Análise das Alternativas Incorretas:

A: Aumentar a complexidade pode piorar o sobreajuste, pois o modelo terá ainda mais facilidade para "decorar" o treino.
  B: Ignorar validação externa impede identificar e corrigir problemas de generalização.
  D: Reduzir demais o conjunto de treino diminui a variedade de exemplos e prejudica o aprendizado.
  E: Ignorar pré-processamento pode introduzir ruídos e padrões irrelevantes, prejudicando o desempenho.

Estratégia para questões similares: Procure sempre identificar sintomas de sobreajuste (alta acurácia apenas no treino) e relacione com soluções clássicas: regularização, validação cruzada, aumento de dados ou técnicas de data augmentation. Fique atento a alternativas que sugerem ignorar etapas essenciais do pipeline de IA.

Gostou do comentário? Deixe sua avaliação aqui embaixo!

🚀 Mais performance?

🚀 Mais performance?

Uma ONG, especializada na busca por gatos desaparecidos, co...

Gabarito comentado

Clique para visualizar este gabarito

Comentários

Clique para visualizar este comentário

Questões de assuntos semelhantes

Provas relacionadas