Suponha que você possua um dataset que represente uma amost...

Próximas questões
Com base no mesmo assunto
Q2277944 Estatística
Suponha que você possua um dataset que represente uma amostra de treinamento balanceada de 500.000 instâncias para classificação binária. Devido à demanda de tempo de processamento dos algoritmos de indução de classificadores que você usará, você definiu que cada treinamento deve ser realizado apenas por 40.000 instâncias e cada teste sobre 10.000 instâncias. Uma vez que 1) cada treinamento e teste demoram juntos 2 horas, 2) você tem disponível apenas 20 horas para executar a estimação de desempenho do algoritmo usado em seus dados, e 3) você quer fazer o máximo de treinamentos/testes possível nessas 20 horas, uma boa estratégia a ser aplicada sobre seu dataset para a estimação de desempenho é:
Alternativas