Questões de Concurso Público TJ-DFT 2022 para Analista Judiciário - Análise de Dados

Foram encontradas 3 questões

Q1936804 Sistemas de Informação
Um cientista de dados está ponderando sobre a aplicação de um modelo Paragraph Vector (PV-DM) sobre uma coleção de documentos, no lugar de usar a média de vetores de palavras em cada documento.
Uma razão pela qual ele deveria aplicar PV-DM, e uma contrapartida à sua aplicação, são, respectivamente:
Alternativas
Q1936805 Sistemas de Informação
Considere o parágrafo a seguir.
“Os beija-flores são aves de pequeno porte, que medem em média de 6 a 12 centímetros de comprimento e pesam de 2 a 6 gramas. Maioria dos bicos são normalmente longos, mas o formato preciso varia bastante com a espécie e está adaptado ao formato da flor que constitui a base da alimentação de cada tipo de beija-flor.
E seu sumário, obtido através de um modelo de sumarização automática:
“Os beija-flores são aves de pequeno porte, com os bicos normalmente longos cujo formato varia com a espécie, dependendo do formato da flor que constitui a base da alimentação de cada tipo de beija-flor.
Com relação à técnica utilizada para essa sumarização, a alternativa que apresenta, respectivamente, o tipo de sumarização realizada e a evidência que nos permite classificá-la é:
Alternativas
Q1936806 Sistemas de Informação
Um analista precisa construir um modelo de tópicos para uma grande base de documentos legais, mas há uma preocupação quanto à interpretabilidade do modelo e à capacidade de inspecionar os resultados.
Considerando essa preocupação, a técnica mais apropriada para a construção do modelo e a razão da escolha são, respectivamente:
Alternativas
Respostas
1: A
2: C
3: C