Uma empresa de e-commerce implantou um modelo de machine le...

Próximas questões
Com base no mesmo assunto
Q3878695 Engenharia de Software
Uma empresa de e-commerce implantou um modelo de machine learning para prever a probabilidade de churn, métrica que indica a rotatividade ou evasão de clientes. Após seis meses em produção, a equipe de dados observou que, embora as distribuições estatísticas das features de entrada permanecessem estáveis (mesmas médias, mesmos desvios-padrão e mesmas distribuições), o relacionamento entre essas features e a variável-alvo (churn) havia mudado significativamente devido a alterações no comportamento dos consumidores causadas por novas políticas de fidelização da empresa. Diante desse cenário, é correto afirmar que o modelo: 
Alternativas

Gabarito comentado

Confira o gabarito comentado por um dos nossos professores

Gabarito: B

Fundamento decisivo: O elemento decisivo foi a comparação entre duas informações do enunciado: as features permaneceram estáveis, mas a relação entre elas e o churn mudou. Essa combinação afasta data drift e caracteriza concept drift.

Tema central: Concept drift
Análise das alternativas
A
Errada
Está errada porque ajustar hiperparâmetros com validação cruzada sobre os dados históricos originais não enfrenta o problema descrito: a relação entre features e target mudou depois. Se o padrão preditivo mudou, é preciso incorporar dados recentes aderentes ao novo comportamento, e não apenas recalibrar o modelo com o histórico antigo.
B
Certa
A alternativa B está certa porque o enunciado descreve mudança na relação entre as variáveis de entrada e a variável-alvo, sem alteração nas distribuições das features. Isso caracteriza concept drift. Como o padrão preditivo aprendido deixou de refletir o comportamento atual dos clientes, a medida compatível é retreinar o modelo com dados recentes que representem o novo cenário.
C
Errada
Está errada porque estabilidade estatística das features não garante que o modelo continue válido. O enunciado afirma justamente que a relação entre entradas e churn mudou; isso já basta para comprometer a capacidade preditiva do modelo, mesmo sem alteração em médias, desvios-padrão ou distribuições das features.
D
Errada
Está errada porque classifica o caso como data drift, mas o enunciado afasta expressamente essa hipótese ao dizer que as características de entrada permaneceram estáveis. O problema descrito não é mudança na distribuição de X, e sim mudança na relação entre X e y.
E
Errada
Está errada porque acrescenta dois pontos sem suporte no enunciado: a ocorrência simultânea de data drift e a necessidade de reprojeto completo do pipeline. A base descrita sustenta apenas concept drift, e não autoriza concluir por nova arquitetura, nova coleta obrigatória ou reformulação integral do sistema.
Pegadinha da questão
A confusão explorada foi fazer o candidato achar que, como o problema surgiu ao longo do tempo e por mudança no negócio, haveria data drift ou até ausência de problema. O ponto real era separar mudança na distribuição das entradas de mudança na relação preditiva entre entradas e alvo.
Dica para questões semelhantes
  • Se a distribuição das features permanece estável, mas a relação entre entradas e alvo muda, trate o caso como concept drift.
  • Não conclua ausência de problema só porque médias, desvios-padrão e distribuições das features ficaram iguais.
  • Quando o padrão preditivo muda por comportamento recente, a resposta compatível é retreinar com dados recentes representativos desse novo padrão.
  • Só fale em data drift quando houver mudança na distribuição dos dados de entrada.

Clique para visualizar este gabarito

Visualize o gabarito desta questão clicando no botão abaixo

Comentários

Veja os comentários dos nossos alunos

A❌ Ajustar hiperparâmetros não resolve o problema, pois a relação entre as variáveis e o churn mudou. Dados históricos antigos não refletem mais o comportamento atual.

B ✅ Correta. Há concept drift, pois as distribuições das features permanecem estáveis, mas a relação entre as features e a variável-alvo (churn) mudou. O modelo deve ser retreinado com dados recentes.

C ❌ A estabilidade das features não garante que o modelo continue eficaz. Mudanças no comportamento dos clientes podem reduzir seu desempenho.

D ❌ Não há data drift, pois as distribuições das features não mudaram. O problema está na relação entre as features e o churn.

E ❌ Não há evidência de data drift. O cenário descreve apenas concept drift, não ambos simultaneamente.

Macete:

Mudou a distribuição das features → Data Drift.

Mudou a relação entre features e target → Concept Drift. ✅

Clique para visualizar este comentário

Visualize os comentários desta questão clicando no botão abaixo