Uma plataforma de e-commerce deseja analisar automaticament...

Próximas questões
Com base no mesmo assunto
Ano: 2025 Banca: FUVEST Órgão: USP Prova: FUVEST - 2025 - USP - Analista de Sistemas |
Q3509645 Sistemas de Informação
Uma plataforma de e-commerce deseja analisar automaticamente as avaliações deixadas pelos clientes nos produtos para determinar se são positivas ou negativas. Para isso, a equipe de ciência de dados está treinando um modelo de aprendizado de máquina para análise de sentimentos. Dado que as avaliações são textos não estruturados, a equipe experimentou diferentes métodos de representação vetorial para transformar os textos em formatos que o modelo pode processar. Após testar diferentes abordagens, eles obtiveram os seguintes resultados em um modelo de classificação de sentimentos:

Imagem associada para resolução da questão

Com base nos resultados apresentados, assinale a alternativa que descreve a melhor escolha de representação vetorial para este problema e sua justificativa.
Alternativas

Comentários

Veja os comentários dos nossos alunos

Alto desempenho no treinamento e baixo desempenho nos testes = Sobreajuste (Overfitting)

Baixo desempenho no treinamento e baixo desempenho nos testes = Subajuste (Underfitting)

Nesta questão, o BoW e o TF-IDF estão apresentando tendência de overfitting, pois possuem alto desempenho no treinamento e, relativamente, baixo desempenho nos testes. Portanto, não devem ser nossas escolhas.

No caso do CBOW e do BERT, ambos possuem um desempenho bom nos treinamentos, havendo uma diferença no desempenho do teste, onde o BERT se sobresai. Logo, gabarito E.

Clique para visualizar este comentário

Visualize os comentários desta questão clicando no botão abaixo