Uma equipe de Engenharia de Computação está pré-processando ...
O processo inicial de PLN que consiste em dividir uma sequência de texto em unidades menores, como palavras, subpalavras ou sentenças é o(a)
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Gabarito: E
Fundamento decisivo: O ponto decisivo foi a descrição da operação inicial de PLN que separa o texto em unidades menores, como palavras, subpalavras ou sentenças. Esse conceito corresponde à tokenização, o que confirma a alternativa E.
- Se o enunciado falar em dividir texto em palavras, subpalavras ou sentenças, o nome técnico da operação é tokenização.
- Stemming e lemmatization atuam sobre palavras já identificadas; não servem para nomear a segmentação inicial da sequência textual.
- Quando a banca pedir o nome exato da operação, descarte termos amplos como normalização se a descrição for especificamente de segmentação.
- Separe etapas de pré-processamento de tarefas de análise final: classificar texto não é o mesmo que preparar o texto.
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
letra e)
(FIOCRUZ/2024/ADAPTADO) Trata-se de dividir o texto em unidades menores, como palavras ou partes de palavras, tranformando o texto bruto e preparando-o para ser manipulado por algoritmos de PLN - Tokenização
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo