Para avaliar o erro de generalização de um classificador, s...
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Para resolver a questão proposta, é fundamental entender as técnicas de validação de modelos de classificação. Essas técnicas são essenciais para avaliar o desempenho de um classificador em dados de teste que não foram usados durante o treinamento. Isso ajuda a garantir que o modelo seja capaz de generalizar bem para dados novos, evitando o problema de overfitting.
Dentre as técnicas de validação citadas na questão, podemos destacar as seguintes:
A - k-fold cross validation: Esta técnica divide o conjunto de dados em k partes ou "folds". Em cada iteração, um fold diferente é usado para validação e os restantes para treinamento. É uma técnica amplamente utilizada para estimar o erro de generalização.
B - leave-one-out: Semelhante ao k-fold, mas aqui o número de folds é igual ao número de dados no conjunto de treinamento. Cada instância é usada uma única vez como conjunto de validação, enquanto todas as outras formam o conjunto de treinamento.
C - bootstrapping: Técnica que envolve a amostragem com reposição. Treina-se o modelo em várias amostras do conjunto de dados, avaliando seu desempenho nas instâncias não amostradas. É útil para estimar a variabilidade do modelo e suas estatísticas.
D - hold-out: O conjunto de dados é dividido em duas partes: uma para treinamento e outra para teste. É uma abordagem mais simples e rápida, mas pode não ser tão robusta quanto as anteriores devido à variabilidade dos resultados em diferentes divisões.
E - split testing: Embora pareça similar a algumas técnicas descritas, não é reconhecida formalmente como uma técnica de validação de modelos de classificação na literatura científica. Geralmente, o termo é mais associado a experimentos A/B em marketing e otimização de sites.
A partir dessa análise, a alternativa correta para a questão é a Alternativa E - split testing, pois é a única que não se encaixa nas técnicas de validação de modelos de classificação conhecidas e utilizadas pela comunidade científica.
É importante também desenvolver a habilidade de interpretar enunciados e identificar palavras-chave como "métodos de validação" e "exceto", que indicam uma exclusão, ajudando a focar na busca pela resposta correta.
Gostou do comentário? Deixe sua avaliação aqui embaixo!
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
k-fold cross validation (validação cruzada do tipo k-fold):
- "Divide o conjunto de teste em k segmentos, utilizando, em cada iteração, um segmento diferente para validação e os demais para treinamento."
leave-one-out:
- Outra técnica consiste em treinar o modelo com o conjunto completo, excluindo apenas um elemento (one-out), que é então usado para teste, e repetindo este processo para cada um dos elementos.
bootstrapping:
- Aqui o autor não deu uma definição no enuncado, mas pense no booststrapping como um método que usamos quando a nossa base não possui um tamanho relativamente pequeno e como saída a esse problema realizamos vários sorteios dos dados. Conforme o pdf do estratégia, bootstrapping é: "O bootstrap é um método de reamostragem que resolve o problema de termos dados insuficientes para gerarmos os conjuntos de treinamento, validação e testes selecionando aleatoriamente dados do conjunto de exemplo, podendo existir repetição."
hold-out (feijão com arroz do Machine Learning):
- Esse eu apelidei de feijão com arroz, pois é o mais comum e simples método. Hold-out é o nome técnico para dizer que você vai separar parte da sua base de dados rotulados para testes, ou seja, seus dados serão divididos em dados de treino e de teste. Fazemos essa divisão pois não é adequado testar o seu modelo de machine learning com os mesmos dados que ele usou para o treino. Essa prática tende a gerar altos valores nas métricas de validação (acurácia, precisão, f1-score, RMSE, etc), contudo, seu modelo pode ser péssimo em achar padrões fora dos dados do treino.
split testing
- Não é um método de validação.
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo