Suponha que você possua um dataset que represente uma
amostra de treinamento balanceada de 500.000 instâncias
para classificação binária. Devido à demanda de tempo de
processamento dos algoritmos de indução de classificadores
que você usará, você definiu que cada treinamento deve ser
realizado apenas por 40.000 instâncias e cada teste sobre
10.000 instâncias. Uma vez que 1) cada treinamento e teste
demoram juntos 2 horas, 2) você tem disponível apenas 20
horas para executar a estimação de desempenho do
algoritmo usado em seus dados, e 3) você quer fazer o
máximo de treinamentos/testes possível nessas 20 horas,
uma boa estratégia a ser aplicada sobre seu dataset para a
estimação de desempenho é:
Incorreta. Gabarito oficial da banca:
Errou um tema comum da banca? Veja o que mais costuma cair no Raio-X. Ver raio-X
teste
Parabéns! Você acertou!
Essa questão segue o padrão da banca! Veja o que mais costuma cair. Ver raio-X