Questões de Concurso Para estatística

Foram encontradas 13.777 questões

Resolva questões gratuitamente!

Junte-se a mais de 4 milhões de concurseiros!

Ano: 2022 Banca: NC-UFPR Órgão: UFPR Prova: NC-UFPR - 2022 - UFPR - Estatístico |
Q1936127 Estatística
Um estudo sobre a relação entre X: renda anual (em dólares) e Y: anos completos de estudo resultou em um coeficiente de correlação linear de Pearson entre X e Y, rXY = 0,907. Considerando as informações apresentadas, assinale a alternativa correta.
Alternativas
Ano: 2022 Banca: NC-UFPR Órgão: UFPR Prova: NC-UFPR - 2022 - UFPR - Estatístico |
Q1936126 Estatística
Com relação aos diferentes métodos em amostragem, assinale a alternativa correta.
Alternativas
Ano: 2022 Banca: NC-UFPR Órgão: UFPR Prova: NC-UFPR - 2022 - UFPR - Estatístico |
Q1936125 Estatística
Considere que a variável S, nível de albumina no sangue (em g/dl), é um indicador do estado nutricional. S foi medido em um grupo de 60 pacientes. A lista dos dados ordenados de S é apresentada na Tabela 1. Além disso, considere que o percentil de ordem q, Pq, de um conjunto de dados, pode ser definido como: Pq = x(q.n/100); sendo que x(i) é o i-ésimo
valor do conjunto de dados ordenados.

Tabela 1 – Dados ordenados de nível de albumina no sangue

Imagem associada para resolução da questão

Considerando as informações apresentadas, assinale a alternativa correta. 
Alternativas
Ano: 2022 Banca: NC-UFPR Órgão: UFPR Prova: NC-UFPR - 2022 - UFPR - Estatístico |
Q1936124 Estatística
As notas finais (F) da disciplina de Estatística para alunos de um certo curso foram as seguintes:
1,5 2,5 3,0 4,0 4,0 4,0 4,0 4,0 4,0 4,0 5,0 5,0 5,0 5,0 5,0 5,0 5,0 6,0 6,0 6,0 7,0 7,0 7,0 8,0 8,0
Há interesse também em analisar as notas dos alunos separados em dois grupos: i) o grupo de aprovados (A), com notas maiores ou iguais a 5; e ii) o grupo de reprovados (R), com as demais notas.

Imagem associada para resolução da questão


Considerando as informações apresentadas, assinale a alternativa correta.
Alternativas
Ano: 2022 Banca: NC-UFPR Órgão: UFPR Prova: NC-UFPR - 2022 - UFPR - Estatístico |
Q1936123 Estatística
Considere a seguinte situação na área epidemiológica:
Durante os anos 1980, aproximadamente 22.000 médicos com mais de 40 anos concordaram em participar de um estudo de longo prazo chamado Physicians’ Health Study. Uma questão investigada foi se a aspirina ajuda a diminuir a ocorrência de enfarto. Os médicos foram aleatoriamente designados para tomar aspirina ou tomar placebo.

(Disponível em: Agresti, A.; Franklin, C. The Art and Science of Learning from Data. Pearson New International. Edição do Kindle.)

Sobre o delineamento do estudo apresentado, é correto afirmar:
Alternativas
Q1934395 Estatística

Considere as duas listas de números a seguir.


Lista 1: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11


Lista 2: 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15


Sejam D1 e D2 os desvios padrão das Listas 1 e 2, respectivamente.


É correto concluir que

Alternativas
Q1933796 Estatística
Situação hipotética 12A3-I

   Deseja-se avaliar, por experimentos laboratoriais, amostras contendo uma mistura de proteínas e peptídeos, juntamente com outras moléculas, obtidas a partir de extratos vegetais. Em uma das etapas experimentais, os peptídeos foram enriquecidos nas amostras. Em outra etapa, a mistura de peptídeos foi diluída em ácido fórmico e submetida a uma análise cromatográfica e, em uma terceira etapa, peptídeos isolados por cromatografia foram analisados por espectrometria de massas. Sabe-se que em todas as amostras há um peptídeo de maior interesse, que é composto por 10 aminoácidos, sem repetições, e apresenta absorção máxima de luz no comprimento de onda de 215 nm.
    Com pertinência à situação hipotética 12A3-I, considere que amostras de 30 plantas nativas (chamadas de N), 30 plantas transgênicas (chamadas de T) e 30 plantas cultivadas em hidroponia (chamadas de H) tenham sido analisadas e tenha sido feita a quantificação da concentração em quantidade de matéria do peptídeo-alvo em cada amostra, com o objetivo de se determinar se há diferença estatisticamente significativa entre as plantas N, T e H. Observou-se que a distribuição dos valores de concentração do peptídeo é compatível com a distribuição normal, que as amostras foram obtidas de forma aleatória e independente e que há homogeneidade de variâncias.
Assinale a opção que corresponde ao teste estatístico que deve ser aplicado para detectar se há diferença significativa quanto à concentração do peptídeo entre quaisquer dos tipos de plantas, sendo este capaz de detectar a diferença se aplicado e calculado apenas uma vez, sem repetições do teste.
Alternativas
Q1933596 Estatística
No contexto da linguagem de programação R, analise as afirmativas a seguir.

I. Vetores (vectors) são listas de itens que devem ter o mesmo tipo.
II. R trabalha com vários tipos de dados (data types), numéricos, lógicos e textuais, mas as variáveis podem mudar de tipo mesmo depois da instanciação.
III. Os itens de uma lista (list) não podem ser substituídos. São permitidas apenas a inserção e a remoção de itens.

Está correto somente o que se afirma em:
Alternativas
Q1933594 Estatística
No contexto da linguagem de programação R, analise o código a seguir.

for (x in 1:10) {    if (x >= 4) {        print(x)        next }    if (x == 8) {break} }

O número de linhas exibidas pela execução desse código é:
Alternativas
Q1933593 Estatística
Um problema comum no processamento de texto é o tratamento de termos compostos por mais de um token, tais como “Ministério Público”, tal que represente uma unidade linguística distinta, em particular na construção de modelos de linguagem.
Considerando o problema acima descrito, a alternativa que apresenta uma técnica usada para sua resolução é:
Alternativas
Q1933592 Estatística
O método Latent Dirichlet Allocation (LDA) é popularmente utilizado para a construção de modelos de tópicos devido a sua flexibilidade e robustez, particularmente em grandes quantidades de texto. Ao mencionar a escolha do LDA em um projeto, um analista foi questionado sobre que aspectos caracterizam a flexibilidade do modelo, especialmente em comparação a um modelo pLSA.
O analista respondeu corretamente:
Alternativas
Q1933591 Estatística
Um modelo semântico vetorial foi criado com a seguinte definição:

 v(w)i = tf(w, di) ∙ idf(w, D)

onde v é o vetor correspondente à palavra w, di é o i-ésimo documento da coleção D de artigos da Wikipédia, ordenados alfabeticamente por título, e tf e idf são, respectivamente, as funções de frequência de termo e inverso da frequência em documentos.
A alternativa que classifica corretamente o modelo acima descrito e apresenta a razão correta para a classificação é: 
Alternativas
Q1933590 Estatística
A atividade de classificação de documentos envolve um grande número de tarefas de processamento de linguagem natural, o que pode levar a dúvidas quanto a sua aplicação.
A alternativa que contém apenas tarefas que sejam exemplos de classificação de documentos é:
Alternativas
Q1933589 Estatística
Para realizar o agrupamento de um conjunto de 4 observações (A, B, C e D) foi decidido usar o método de agrupamento hierárquico aglomerativo com ligação simples (single-linkage).
A matriz de distância inicial entre os elementos é apresentada a seguir.

Imagem associada para resolução da questão

Considerando essas informações, a matriz de distância obtida após o primeiro passo do agrupamento é:
Alternativas
Q1933586 Estatística
Uma biblioteca está classificando os seus frequentadores em grupos literários para facilitar a aquisição e a organização dos livros. Isso foi feito aplicando o algoritmo KNN ao banco de dados de usuários da biblioteca, incluindo alguns dos campos de informação como atributos, tais como idade e nível de formação acadêmica. Em um experimento, uma segunda classificação foi feita usando um conjunto maior de atributos, incluindo ambos de maior ou menor relevância percebida com relação aos grupos definidos.
A segunda classificação tende a ser:
Alternativas
Q1933585 Estatística
Em um trabalho de pesquisa, as idades das pessoas são: 23, 27, 32, 33, 34, 35, 36, 38, 42, 56 e 58. Deseja-se construir um boxplot similar ao gráfico a seguir. 

Imagem associada para resolução da questão

No boxplot acima, os valores das estatísticas nas posições indicadas pelas letras A, B, C, D, E e F são: 
Alternativas
Q1933584 Estatística
Uma prefeitura recebeu uma denúncia de que o número de autuações feitas pela equipe de fiscalização variava conforme o dia da semana. Para verificar a procedência da denúncia, as autuações foram agregadas por dia de semana, como mostra a tabela a seguir.

Segundas      6     Terças       12   Quartas       9   Quintas       8     Sextas      15   Sábados    13 Domingos    7

Realizando um teste estatístico adequado para verificar se essas autuações ocorrem com a mesma frequência, teremos: 
Alternativas
Q1933583 Estatística
Uma empresa recebeu um lote muito grande, milhões de peças de refugo, e deseja saber quantas peças deverá examinar para estimar a proporção de itens defeituosos, de modo que o erro de estimação seja no máximo 2%. Será empregada uma seleção aleatória de itens onde cada um será classificado como defeituoso ou não defeituoso. Deseja-se extrair uma amostra aleatória de tamanho n.
Tendo como padrão um grau de confiança de 95%, o tamanho da amostra necessário para garantir o processo é:
Alternativas
Q1933582 Estatística
Em um processo de descontaminação é importante manter um controle da variabilidade da contaminação residual que persiste após o processo. Sabe-se que a mensuração do resíduo tem distribuição normal, e que a partir de uma amostra aleatória, de 21 unidades, foi calculada a variância S2 = 54,25. Para estabelecer uma medida máxima de referência, decidiu-se utilizar o intervalo de confiança superior para o desvio padrão.
O valor desse limite a 95% de confiança é:
Alternativas
Q1933581 Estatística
Abaixo temos o gráfico quantil-quantil para distribuição normal onde estão desenhados os valores de duas amostras da distribuição Normal. A amostra 1, representada por círculos, e a amostra 2, representada por “x”.

Imagem associada para resolução da questão

Com base no gráfico, é correto afirmar que as duas distribuições têm:
Alternativas
Respostas
4741: A
4742: A
4743: E
4744: B
4745: C
4746: A
4747: B
4748: D
4749: B
4750: D
4751: A
4752: C
4753: C
4754: C
4755: E
4756: A
4757: A
4758: E
4759: B
4760: D