Na modelagem estatística utilizando aprendizado de máquina, a principal razão para separar os dados em conjuntos de treinamento, validação e teste é

Question

A

avaliar desempenho generalizável e evitar overfitting.

B

reduzir a dimensionalidade dos preditores.

C

aumentar a variância do modelo.

D

garantir normalidade dos resíduos.

E

reduzir o viés do estimador dos coeficientes.

Incorreta. Gabarito oficial da banca:

Veja como esse erro impacta seu desempenho geral. Ver estatísticas

teste

Parabéns! Você acertou!

Esse acerto melhora seu desempenho! Veja suas estatísticas

teste

Adriano Pereira · Accepted Answer

Alternativa [A] avaliar desempenho generalizável e evitar overfitting. Análise das Alternativas Incorretas﻿B) Reduzir a dimensionalidade: Isso é feito por técnicas como PCA (Análise de Componentes Principais) ou seleção de variáveis (feature selection), não pela divisão dos dados. C) Aumentar a variância: Na verdade, queremos o contrário. Alta variância é sinal de overfitting (o modelo é sensível demais a ruídos do treino). Queremos um equilíbrio entre viés e variância. D) Garantir normalidade dos resíduos: Essa é uma suposição clássica da regressão linear estatística para testes de hipótese, mas não é o motivo da separação de conjuntos em machine learning. E) Reduzir o viés do estimador: O viés está ligado à simplicidade do modelo (Underfitting). Separar os dados ajuda a medir o viés, mas a separação em si não o reduz (isso exigiria um modelo mais complexo ou melhores variáveis).

🎯 Saiba o que estudar

🎯 Saiba o que estudar

Na modelagem estatística utilizando aprendizado de máquina, ...

Comentários

Clique para visualizar este comentário

Questões de assuntos semelhantes

Provas relacionadas