O aprendizado de máquina (machine learning) é frequentemente...
A principal diferença conceitual entre essas duas abordagens reside no fato de que, no aprendizado supervisionado:
Comentários
Veja os comentários dos nossos alunos
No aprendizado supervisionado, o modelo é treinado com dados já rotulados, ou seja, para cada entrada existe uma saída correta conhecida. O objetivo é aprender uma função que relacione entrada → saída, permitindo prever resultados para novos dados.
Qual o erro da C?
Brevemente:
No aprendizado supervisionado, os modelos são treinados usando dados rotulados, onde cada entrada é pareada com uma saída conhecida. O modelo aprende comparando suas previsões com essas respostas corretas e reduzindo o erro iterativamente.
Aprendizado não supervisionado: Em vez de aprender com exemplos rotulados, o aprendizado não supervisionado de máquina analisa dados não rotulados para identificar padrões, estrutura ou relacionamentos sem alvos predefinidos.
fonte: Aprendizado Supervisionado vs. Não Supervisionado: Escolhendo a Abordagem Certa de Machine Learning | Blog Databricks
A alternativa correta é a B: o conjunto de dados de treinamento contém pares de dados de entrada e seus respectivos rótulos (labels) ou respostas corretas desejadas;
No aprendizado supervisionado, o algoritmo aprende a partir de um "professor" ou "supervisor" (daí o nome). Na prática, isso significa que alimentamos o modelo com dados de entrada já mapeados para as respostas corretas (os rótulos ou labels). O objetivo do algoritmo é aprender a função matemática que conecta a entrada à saída, para que ele possa prever o rótulo de novos dados no futuro.
- Exemplo clássico: Um filtro de spam precisa de milhares de e-mails já marcados manualmente como "Spam" ou "Não Spam" para aprender a diferenciar um do outro.
- A está incorreta: Esta é a definição exata de aprendizado não supervisionado (onde o algoritmo agrupa dados por semelhança sem saber o que eles significam previamente).
- C está incorreta: Esta é a definição de aprendizado por reforço (comum em robótica e jogos, como o xadrez ou o AlphaGo).
- D está incorreta: A redução de dimensionalidade é uma técnica típica do aprendizado não supervisionado (como o PCA - Análise de Componentes Principais).
- E está incorreta: A separação entre treino e teste é fundamental no aprendizado supervisionado para garantir que o modelo realmente aprendeu a generalizar e não apenas "decorou" os dados de treino (overfitting).
A principal característica do aprendizado supervisionado (supervised learning) é que o algoritmo aprende a partir de um conjunto de treinamento que contém:
- Entradas (features ou atributos); e
- Saídas corretas (rótulos/labels) associadas a essas entradas.
O objetivo é aprender uma função que consiga prever corretamente a saída para novos dados.
Análise das alternativas:
- A) Incorreta. Descreve o aprendizado não supervisionado, no qual não há rótulos e o algoritmo busca padrões ocultos (clusters, associações etc.).
- B) Correta. No aprendizado supervisionado, o conjunto de treinamento contém pares (entrada, saída desejada).
- C) Incorreta. Descreve o aprendizado por reforço (Reinforcement Learning), baseado em recompensas e punições.
- D) Incorreta. Redução de dimensionalidade é uma técnica específica (como PCA), muito utilizada em aprendizado não supervisionado, mas não é o objetivo principal do aprendizado supervisionado.
- E) Incorreta. Mesmo no aprendizado supervisionado, normalmente os dados são separados em conjuntos de treino, validação e/ou teste para avaliar a capacidade de generalização do modelo.
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo