Durante a elaboração de um sistema de busca de informações
biomédicas, foi construído um modelo de linguagem vetorial não
contextual para estimar relações de similaridade semântica
necessárias para comparação entre queries e documentos.
Entretanto, verificou-se nos testes iniciais que o desempenho do
modelo ficou insatisfatório, devido a muitos termos técnicos
presentes nos documentos testados, que não haviam sido
incorporados ao modelo.
Para aliviar esse problema, uma tarefa de processamento do
texto e seu estágio correspondente no processamento de
linguagem natural que poderiam ser aplicados na construção do
modelo são, respectivamente: