Observe o código Python abaixo, que utiliza a biblioteca NLT...
import nltk nltk.download(‘punkt’) from nltk.tokenize import word_tokenize
texto = “Fundação Oswaldo Cruz (Fiocruz): Ciência e tecnologia em saúde para a população brasileira.” tokens = word_tokenize(texto)
contador = 0 resultado = 0 while contador < len(tokens): for letra in tokens[contador]: if letra.upper() in ‘FIOCRUZ’: resultado += 1 contador += 1
O valor da variável resultado, ao final da execução do código, é:
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Gabarito: A
Fundamento decisivo: O que decidia a questão era a contagem, em cada token gerado por word_tokenize, de cada caractere cujo upper() pertence à string 'FIOCRUZ'.
- Quando houver laço sobre token e laço interno sobre caractere, verifique se a soma ocorre por ocorrência de letra, e não por palavra.
- Em expressões do tipo caractere in "STRING", leia como teste de pertencimento a um conjunto de caracteres, não como busca de palavra inteira.
- Se houver upper() antes da comparação, trate a verificação como insensível a maiúsculas e minúsculas, mas sem eliminar acentos.
- Pontuação pode virar token separado na tokenização, mas só altera o resultado se também satisfizer a condição do if.
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo