O aprendizado de máquina (machine learning) é frequentemente...

Próximas questões
Com base no mesmo assunto
Q3874743 Noções de Informática
O aprendizado de máquina (machine learning) é frequentemente categorizado em diferentes paradigmas, dependendo da natureza dos dados disponíveis e do problema a ser resolvido. Dois dos tipos mais comuns são o aprendizado supervisionado e o aprendizado não supervisionado.
A principal diferença conceitual entre essas duas abordagens reside no fato de que, no aprendizado supervisionado: 
Alternativas

Gabarito comentado

Confira o gabarito comentado por um dos nossos professores

Gabarito: B

Fundamento decisivo: A evidência decisiva é a definição de aprendizado supervisionado com exemplos de entrada acompanhados de rótulos ou saídas desejadas, o que corresponde à alternativa B.

Tema central: Aprendizado supervisionado
Análise das alternativas
A
Errada
Está errada porque descreve dados sem classificação prévia e a busca de padrões ou estruturas ocultas, o que caracteriza aprendizado não supervisionado, não supervisionado.
B
Certa
A alternativa B está correta porque expressa o critério que define o aprendizado supervisionado: o modelo é treinado com pares de entrada e saída correta desejada. A presença de rótulos no conjunto de treinamento é justamente o elemento conceitual que distingue essa abordagem das demais.
C
Errada
Está errada porque trata de aprendizado por reforço: interação com ambiente e recebimento de recompensa ou punição pelas ações. Esse não é o critério definidor do aprendizado supervisionado.
D
Errada
Está errada porque redução de dimensionalidade é uma técnica que pode aparecer em alguns contextos, especialmente não supervisionados, mas não define o paradigma supervisionado nem é sempre o objetivo principal.
E
Errada
Está errada porque afirmar que não é necessário separar treino e teste é operacionalmente incorreto como regra geral. Além disso, essa afirmação não responde à diferença conceitual entre aprendizado supervisionado e não supervisionado.
Pegadinha da questão
A questão explora a confusão entre paradigmas ao misturar dados sem rótulos, aprendizado por reforço e técnica específica, quando o ponto decisivo é a presença de rótulos no treinamento.
Dica para questões semelhantes
  • Se a alternativa mencionar dados rotulados ou pares entrada-saída correta, o critério aponta para aprendizado supervisionado.
  • Se a alternativa falar em descobrir padrões sem rótulos, o paradigma é não supervisionado, não supervisionado.
  • Se aparecer interação com ambiente, recompensa ou punição, trata-se de aprendizado por reforço.
  • Diferencie definição do paradigma de técnica específica ou prática de avaliação; nem redução de dimensionalidade nem separação treino-teste definem supervisionado.

Clique para visualizar este gabarito

Visualize o gabarito desta questão clicando no botão abaixo

Comentários

Veja os comentários dos nossos alunos

No aprendizado supervisionado, o modelo é treinado com dados já rotulados, ou seja, para cada entrada existe uma saída correta conhecida. O objetivo é aprender uma função que relacione entrada → saída, permitindo prever resultados para novos dados.

Qual o erro da C?

Brevemente:

No aprendizado supervisionado, os modelos são treinados usando dados rotulados, onde cada entrada é pareada com uma saída conhecida. O modelo aprende comparando suas previsões com essas respostas corretas e reduzindo o erro iterativamente.

Aprendizado não supervisionado: Em vez de aprender com exemplos rotulados, o aprendizado não supervisionado de máquina analisa dados não rotulados para identificar padrões, estrutura ou relacionamentos sem alvos predefinidos.

fonte: Aprendizado Supervisionado vs. Não Supervisionado: Escolhendo a Abordagem Certa de Machine Learning | Blog Databricks

A alternativa correta é a B: o conjunto de dados de treinamento contém pares de dados de entrada e seus respectivos rótulos (labels) ou respostas corretas desejadas;

No aprendizado supervisionado, o algoritmo aprende a partir de um "professor" ou "supervisor" (daí o nome). Na prática, isso significa que alimentamos o modelo com dados de entrada já mapeados para as respostas corretas (os rótulos ou labels). O objetivo do algoritmo é aprender a função matemática que conecta a entrada à saída, para que ele possa prever o rótulo de novos dados no futuro.

  • Exemplo clássico: Um filtro de spam precisa de milhares de e-mails já marcados manualmente como "Spam" ou "Não Spam" para aprender a diferenciar um do outro.
  • A está incorreta: Esta é a definição exata de aprendizado não supervisionado (onde o algoritmo agrupa dados por semelhança sem saber o que eles significam previamente).
  • C está incorreta: Esta é a definição de aprendizado por reforço (comum em robótica e jogos, como o xadrez ou o AlphaGo).
  • D está incorreta: A redução de dimensionalidade é uma técnica típica do aprendizado não supervisionado (como o PCA - Análise de Componentes Principais).
  • E está incorreta: A separação entre treino e teste é fundamental no aprendizado supervisionado para garantir que o modelo realmente aprendeu a generalizar e não apenas "decorou" os dados de treino (overfitting).

A principal característica do aprendizado supervisionado (supervised learning) é que o algoritmo aprende a partir de um conjunto de treinamento que contém:

  • Entradas (features ou atributos); e
  • Saídas corretas (rótulos/labels) associadas a essas entradas.

O objetivo é aprender uma função que consiga prever corretamente a saída para novos dados.

Análise das alternativas:

  • A) Incorreta. Descreve o aprendizado não supervisionado, no qual não há rótulos e o algoritmo busca padrões ocultos (clusters, associações etc.).
  • B) Correta. No aprendizado supervisionado, o conjunto de treinamento contém pares (entrada, saída desejada).
  • C) Incorreta. Descreve o aprendizado por reforço (Reinforcement Learning), baseado em recompensas e punições.
  • D) Incorreta. Redução de dimensionalidade é uma técnica específica (como PCA), muito utilizada em aprendizado não supervisionado, mas não é o objetivo principal do aprendizado supervisionado.
  • E) Incorreta. Mesmo no aprendizado supervisionado, normalmente os dados são separados em conjuntos de treino, validação e/ou teste para avaliar a capacidade de generalização do modelo.

Clique para visualizar este comentário

Visualize os comentários desta questão clicando no botão abaixo