Em aprendizado de máquina supervisionado, o fenômeno overfit...
Comentários
Veja os comentários dos nossos alunos
alternativa correta é a E (baixo viés e alta variância, com acurácia em teste inferior à observada em treino).
O fenômeno do overfitting (sobreajuste) ocorre quando o modelo de aprendizado de máquina "decora" o ruído e os detalhes específicos dos dados de treinamento, em vez de aprender o padrão geral que rege os dados.
Para entender o overfitting, analisamos o Trade-off Viés-Variância:
- Baixo Viés: O modelo se ajusta muito bem aos dados de treino, apresentando um erro mínimo nesta etapa. Ele é flexível o suficiente para capturar quase todas as flutuações.
- Alta Variância: O modelo é extremamente sensível a pequenas variações nos dados. Se você mudar levemente o conjunto de treino, as previsões mudam drasticamente.
- Desempenho: A consequência direta é uma acurácia excelente no treino, mas uma acurácia ruim no teste (ou validação), pois o modelo não consegue generalizar para dados que nunca viu antes.
- Underfitting (Subajuste): Ocorre quando o modelo é simples demais (ex: tentar ajustar uma reta em dados circulares). Apresenta alto viés e baixa variância. O erro é alto tanto no treino quanto no teste.
- Modelo Ideal: O equilíbrio onde temos baixo viés e baixa variância, resultando em boa generalização.
- Regularização (Lasso/Ridge): Penaliza coeficientes muito grandes.
- Cross-Validation: Garante que o modelo seja testado em diferentes partes dos dados.
- Aumento de dados: Fornecer mais exemplos para o modelo aprender o padrão real.
- Pruning (Poda): Em árvores de decisão, limita o crescimento da árvore.
letra e)
O viés aparece quando o algoritmo aprende um modelo incorreto, muitas vezes pode ser associado à ideia de underfitting, pois não consegue induzir um modelo que se ajusta aos dados. Já variância está relacionada ao fato de o algoritmo prestar atenção a detalhes sem importância, criando um modelo complexo e pesado, levando a um termo conhecido como overfitting.
Overfitting - treina bem, joga mal
Underfitting - treina mal, joga mal
Essa é a definição clássica de overfitting: o modelo aprende demais os detalhes e ruídos dos dados de treinamento, e por isso não generaliza bem para dados novos.
Fonte: Estratégia + meus resumos
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo