Em aprendizado de máquina supervisionado, o fenômeno overfit...

Próximas questões
Com base no mesmo assunto
Q3952839 Estatística
Em aprendizado de máquina supervisionado, o fenômeno overfitting ocorre quando o modelo apresenta 
Alternativas

Comentários

Veja os comentários dos nossos alunos

alternativa correta é a E (baixo viés e alta variância, com acurácia em teste inferior à observada em treino).

O fenômeno do overfitting (sobreajuste) ocorre quando o modelo de aprendizado de máquina "decora" o ruído e os detalhes específicos dos dados de treinamento, em vez de aprender o padrão geral que rege os dados.

Para entender o overfitting, analisamos o Trade-off Viés-Variância:

  • Baixo Viés: O modelo se ajusta muito bem aos dados de treino, apresentando um erro mínimo nesta etapa. Ele é flexível o suficiente para capturar quase todas as flutuações.
  • Alta Variância: O modelo é extremamente sensível a pequenas variações nos dados. Se você mudar levemente o conjunto de treino, as previsões mudam drasticamente.
  • Desempenho: A consequência direta é uma acurácia excelente no treino, mas uma acurácia ruim no teste (ou validação), pois o modelo não consegue generalizar para dados que nunca viu antes.
  • Underfitting (Subajuste): Ocorre quando o modelo é simples demais (ex: tentar ajustar uma reta em dados circulares). Apresenta alto viés e baixa variância. O erro é alto tanto no treino quanto no teste.
  • Modelo Ideal: O equilíbrio onde temos baixo viés e baixa variância, resultando em boa generalização.

  1. Regularização (Lasso/Ridge): Penaliza coeficientes muito grandes.
  2. Cross-Validation: Garante que o modelo seja testado em diferentes partes dos dados.
  3. Aumento de dados: Fornecer mais exemplos para o modelo aprender o padrão real.
  4. Pruning (Poda): Em árvores de decisão, limita o crescimento da árvore.

letra e)

O viés aparece quando o algoritmo aprende um modelo incorreto, muitas vezes pode ser associado à ideia de underfitting, pois não consegue induzir um modelo que se ajusta aos dados. Já variância está relacionada ao fato de o algoritmo prestar atenção a detalhes sem importância, criando um modelo complexo e pesado, levando a um termo conhecido como overfitting.

Overfitting - treina bem, joga mal

Underfitting - treina mal, joga mal

Essa é a definição clássica de overfitting: o modelo aprende demais os detalhes e ruídos dos dados de treinamento, e por isso não generaliza bem para dados novos.

Fonte: Estratégia + meus resumos

Clique para visualizar este comentário

Visualize os comentários desta questão clicando no botão abaixo