Uma equipe de cientistas de dados desenvolve um modelo pred...

Próximas questões
Com base no mesmo assunto
Ano: 2025 Banca: FUVEST Órgão: USP Prova: FUVEST - 2025 - USP - Analista de Sistemas |
Q3509626 Estatística
Uma equipe de cientistas de dados desenvolve um modelo preditivo para estimar o preço de carros usados com base em variáveis como ano de fabricação, quilometragem, marca e número de proprietários anteriores.
Assinale a alternativa que apresenta a abordagem mais adequada para construir este modelo preditivo.
Alternativas

Comentários

Veja os comentários dos nossos alunos

https://youtu.be/xMvq8H-kmbU Tempo: 13:49

Esta questão foca na escolha da técnica de modelagem correta com base na natureza do problema (prever um valor numérico contínuo) e na quantidade de variáveis disponíveis.

  • A) Incorreta. A Regressão Linear Simples utiliza apenas uma variável preditora. Ignorar o ano de fabricação, a marca e o histórico de proprietários resultaria em um modelo muito pobre e com alto viés, pois esses fatores impactam severamente o preço.
  • B) Incorreta. A Regressão Logística é um algoritmo de classificação (usado para prever categorias como "Sim/Não" ou "Caro/Barato"). Como o objetivo é estimar o preço (um valor numérico contínuo), devemos usar modelos de regressão.
  • C) Incorreta. Variáveis categóricas, como a marca do carro, são fundamentais na precificação. Na ciência de dados, tratamos essas variáveis usando técnicas como One-Hot Encoding ou Label Encoding para que o modelo possa processá-las, em vez de simplesmente excluí-las.
  • D) Incorreta. A Regressão Polinomial pode ser útil, mas afirmar que ela sempre deve considerar uma relação quadrática específica é um erro conceitual. A relação entre quilometragem e preço pode não ser quadrática, e forçar esse formato sem análise prévia pode causar overfitting ou erros de interpretação.
  • E) Correta. A Regressão Linear Múltipla é a abordagem ideal quando queremos prever uma variável dependente numérica (Preço) com base em duas ou mais variáveis independentes (ano, km, marca, etc.). Ela permite calcular o peso (coeficiente) de cada fator no preço final.

Diferente da regressão simples, a fórmula da múltipla acomoda todos os fatores mencionados:

Y=β0​+β1​X1​+β2​X2​+β3​X3​+...+ϵ

Onde:

  • Y: Preço do carro.
  • X1: Quilometragem.
  • X2​: Ano de fabricação.
  • X3: Marca (após codificação).

Alternativa Correta: E

Clique para visualizar este comentário

Visualize os comentários desta questão clicando no botão abaixo