Uma empresa de e-commerce implantou um modelo de machine lea...

Próximas questões
Com base no mesmo assunto
Q3874745 Engenharia de Software
Uma empresa de e-commerce implantou um modelo de machine learning para prever a probabilidade de churn, métrica que indica a rotatividade ou evasão de clientes. Após seis meses em produção, a equipe de dados observou que, embora as distribuições estatísticas das features de entrada permanecessem estáveis (mesmas médias, mesmos desvios-padrão e mesmas distribuições), o relacionamento entre essas features e a variável-alvo (churn) havia mudado significativamente devido a alterações no comportamento dos consumidores causadas por novas políticas de fidelização da empresa.
Diante desse cenário, é correto afirmar que o modelo: 
Alternativas

Gabarito comentado

Confira o gabarito comentado por um dos nossos professores

Gabarito: B

Fundamento decisivo: O ponto decisivo foi a estabilidade das features de entrada combinada com a mudança na relação entre essas features e o churn. Como o enunciado exclui alteração nas distribuições de entrada e aponta mudança no vínculo preditivo, o caso é de concept drift, o que leva ao gabarito B.

Tema central: Concept drift
Análise das alternativas
A
Errada
Está errada porque trata o problema como se bastasse ajustar hiperparâmetros usando os dados históricos originais. A base afirma que a relação features-target mudou; portanto, depender apenas do padrão antigo não enfrenta o drift conceitual descrito.
B
Certa
A alternativa B está correta porque identifica o critério técnico pertinente: houve mudança no padrão preditivo que liga as entradas ao alvo, e não mudança nas distribuições das entradas em si. Esse é o conceito operacional de concept drift. Nesse cenário, o modelo treinado com o padrão anterior tende a perder capacidade preditiva, de modo que o retreinamento com dados recentes compatíveis com o novo comportamento é a medida sustentada pela base.
C
Errada
Está errada porque estabilidade de médias, desvios-padrão e distribuições das features não garante manutenção da performance. O enunciado informa justamente que o relacionamento entre entradas e alvo mudou, e isso afeta a capacidade preditiva do modelo.
D
Errada
Está errada porque data drift exige mudança nas características ou distribuições dos dados de entrada, e o enunciado afirma expressamente que essas distribuições permaneceram estáveis. Além disso, a exigência de feature engineering adicional não decorre necessariamente das informações fornecidas.
E
Errada
Está errada porque não há base para afirmar data drift simultaneamente ao concept drift, já que o enunciado afasta mudança na distribuição das features. Também não há suporte na base para concluir pela necessidade de reprojeto completo do pipeline, nova coleta de dados ou mudança de arquitetura.
Pegadinha da questão
A confusão entre mudança na distribuição das features e mudança na relação entre features e target. A questão induz ao erro ao mencionar estabilidade estatística das entradas, como se isso bastasse para afastar problema no modelo.
Dica para questões semelhantes
  • Se as distribuições das features permanecem estáveis, isso por si só não autoriza falar em data drift.
  • Se o que mudou foi a relação entre entradas e alvo ao longo do tempo, o diagnóstico compatível é concept drift.
  • Quando há concept drift, reavaliar e retreinar com dados recentes é compatível com o problema; usar apenas dados históricos antigos não resolve o ponto central.

Clique para visualizar este gabarito

Visualize o gabarito desta questão clicando no botão abaixo