A seleção de características (feature selection) é uma etap...
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Alternativa correta: C
Vamos compreender o tema central desta questão sobre seleção de características no aprendizado de máquina. Este conceito é crucial para melhorar o desempenho dos modelos, especialmente em problemas de alta dimensionalidade. A seleção de características pode reduzir o tempo de treinamento, melhorar a precisão dos modelos e facilitar a interpretação dos resultados.
Resumo teórico: A seleção de características é o processo de identificar e utilizar apenas as características mais relevantes de um conjunto de dados para a construção de modelos preditivos. Existem três abordagens principais para isso:
- Filtros: Métodos que utilizam métricas estatísticas para selecionar características independentemente do algoritmo de aprendizado.
- Embutidos (Embedded): Integram a seleção de características diretamente no processo de construção do modelo, como árvores de decisão.
- Wrappers: Utilizam um algoritmo de aprendizado para selecionar subconjuntos de características, geralmente mais precisos, mas computacionalmente caros.
Agora, vamos justificar por que a alternativa C é correta:
A alternativa C afirma que a seleção de características "pode aumentar a velocidade de treinamento do modelo independentemente do tamanho do conjunto de dados". Isso está correto porque, ao reduzir o número de características, a complexidade do modelo também é reduzida, o que geralmente diminui o tempo necessário para treinamento, independentemente do tamanho original do conjunto de dados. Fontes confiáveis, como o livro "Pattern Recognition and Machine Learning" de Christopher Bishop, corroboram essa ideia.
Vamos agora analisar as alternativas incorretas:
Alternativa A: Incorreta porque a seleção de características pode sim melhorar a precisão do modelo ao remover características irrelevantes ou ruidosas, que podem interferir negativamente na performance do modelo.
Alternativa B: Incorreta porque contradiz o conhecimento estabelecido de que a seleção de características pode ser feita usando métodos de filtro, embutidos e de wrapper, como mencionado anteriormente.
Alternativa D: Incorreta porque a seleção de características não é necessária apenas no contexto de overfitting; ela é útil em várias situações para otimizar o desempenho do modelo.
Alternativa E: Incorreta porque a afirmação de que a seleção de características não reduz a complexidade do modelo é oposta à realidade. Na verdade, ela reduz a complexidade e facilita a interpretação, além de ajudar a mitigar o risco de overfitting.
Gostou do comentário? Deixe sua avaliação aqui embaixo!
```Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo