Uma Analista está desenvolvendo um modelo de aprendizado de ...
A lacuna I deve ser corretamente
Comentários
Veja os comentários dos nossos alunos
A questão envolve:
- Pré-processamento com OneHotEncoder: Para variáveis categóricas.
- Classificador: Uma árvore de decisão (DecisionTreeClassifier) com parâmetros padrão.
- Pipeline: Deve funcionar corretamente com dados de treino e teste.
Análise das alternativas:
- (A) usa DecisionTreeRegressor(), o que está incorreto, pois o problema envolve classificação, não regressão.
- (B) mistura DecisionTreeRegressor com criterion='gini', o que não é parâmetro válido para regressão (esse critério é usado para classificação).
- (C) usa LabelEncoder, que não é apropriado para uso direto no pipeline de entrada, pois não lida com colunas categóricas múltiplas e não é compatível com fit_transform de DataFrames. Além disso, não está importado corretamente.
- (D) está correta: OneHotEncoder(handle_unknown='ignore') lida bem com categorias não vistas nos dados de teste. DecisionTreeClassifier() é o classificador correto com parâmetros padrão.
- (E) usa LabelBinarizer, que também não é adequado para múltiplas colunas e é indicado mais para binarizar rótulos, não features.
By Futuro DEV Estável.
É só olhar para os imports no topo da questão:
- OneHotEncoder
- DecisionTreeClassifier
No rodapé do algoritmo você não pode chamar algo diferente do que você importou.
Questão que cobra somente atenção.
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo