O Processamento de Linguagem Natural (PLN) busca melhorar a...
COLUNA 1
(1) Tokenização, (2) POS Tagging, (3) Stemização, (4) Lematização e (5) Chunking.
COLUNA 2
( ) Técnica que transforma uma palavra para sua forma de dicionário, considerando o contexto, a classe gramatical e outras características linguísticas.
( ) Trata de dividir o texto em unidades menores, como palavras ou partes de palavras, transformando o texto bruto e preparando-o para ser manipulado por algoritmos de PLN.
( ) Refere-se a reduzir as palavras para suas formas radicais, facilitando a análise de padrões comuns em diferentes variações da mesma palavra.
( ) Técnica de atribuir a cada palavra em um texto a sua classe morfossintática, como substantivos, verbos, adjetivos, etc.
( ) Trata de dividir um texto em segmentos mais curtos, como conjuntos de palavras ou seções de um texto, que serão tratados separadamente em processos posteriores como, por exemplo, vetorização.
A sequência correta, de cima para baixo, é:
- Gabarito Comentado (1)
- Aulas (12)
- Comentários (1)
- Estatísticas
- Cadernos
- Criar anotações
- Notificar Erro
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Gabarito: E
Fundamento decisivo: O ponto decisivo era a identificação correta das definições de lematização, tokenização, stemização, POS Tagging e chunking no enunciado, o que conduz à sequência 4-1-3-2-5 e, portanto, à alternativa E.
- Se a definição fala em forma de dicionário com contexto e classe gramatical, marque lematização, não stemização.
- Se a operação divide em palavras ou subpalavras, é tokenização; se agrupa em segmentos maiores para processamento posterior, é chunking.
- Quando a definição menciona atribuir classe gramatical a cada palavra, o rótulo correto é POS Tagging.
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo
Comentários
Veja os comentários dos nossos alunos
Gab: E: 4 1 3 2 5. O minecraft deu o gabarito rsrs
Pre-processamento de texto
Tokens VS chunks:
- Tokens: subpartes menores - maior granularidade - estão contidos num chunk - podem ser palavras ou partes de palavras
- Chunks: subpartes maiores - menor granularidade - são compostos por tokens - podem ser conjuntos de palavras
Stemização VS Lematização:
- Stemização: reduz palavras flexionadas/derivadas a sua raiz/tronco (stem)/radical
- Lematização: reduz palavras à forma de dicionário (lema), observando as regras linguísticas e o significado da palavra no contexto.
POS tagging: etiquetas de classificação gramatical
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo