Tendo o texto como referência inicial, julgue o item subsecu...
Tendo o texto como referência inicial, julgue o item subsecutivo, a respeito de aprendizado de máquina.
O aprendizado por reforço é essencialmente uma forma de aprendizagem não supervisionada, pois seu objetivo principal é descobrir padrões ocultos e agrupamento nos dados, sem uso de rótulos; nesse paradigma, a recompensa funciona como um critério secundário de avaliação.