Questões de Concurso Comentadas sobre estatística descritiva (análise exploratória de dados) em estatística

Foram encontradas 869 questões

Q2101311 Estatística
Sejam x1, x2,…, x100 valores distintos observados de uma variável aleatória contínua X que tem distribuição unimodal, formando uma amostra de tamanho n = 100. Denote a média aritmética simples amostral por Imagem associada para resolução da questão e a moda da amostra por Mo(x), a qual é igual à metade de Imagem associada para resolução da questão . É necessariamente correto afirmar que: 
Alternativas
Q2101306 Estatística
Ao analisar os dados de uma variável X, Gilberto calculou medidas de dispersão como o desvio-padrão S dos dados. Entretanto, Gilberto foi comunicado que, após uma mudança na legislação, será melhor trabalhar com a transformação Y = 3X + 7. Após realizar a devida transformação em sua base de dados, o desvio-padrão calculado da variável transformada será dado por: 
Alternativas
Q2101305 Estatística

Um analista do Ministério Público supõe que existe uma relação linear entre duas variáveis não negativas: o número de denúncias de infrações ambientas (y) e o acesso à informação e comunicação (x) de diferentes regiões administrativas. Para verificar sua hipótese, realizou um estudo e obteve o seguinte diagrama de dispersão:


Imagem associada para resolução da questão


Considere que r seja o coeficiente de correlação linear amostral entre as variáveis e que b seja o coeficiente de inclinação no ajuste da reta de regressão y = a + bx aos dados observados. Com base nessas informações, é correto afirmar que:

Alternativas
Q2101298 Estatística
O tempo de atendimento Y, em minutos, de um setor de processos de determinada repartição pública possui função densidade de probabilidade acumulada dada por:

F (y) = 1 – e–λy , y > 0 e λ > 0,

em que λ é um parâmetro populacional. Qual é o tempo mediano, em minutos, de atendimento nesse setor?
Alternativas
Q2100917 Estatística
A tabela representa a distribuição das notas de desempenho dos candidatos em um processo de seleção para uma vaga de emprego. A última fase do processo de seleção consiste em uma entrevista, que será realizada apenas com os candidatos que obtiveram desempenho acima da nota de corte, calculada com base no valor do sexto decil, cujo valor é 51,8:
Imagem associada para resolução da questão

“De acordo com os dados apresentados, é correto afirmar que 60% dos candidatados obtiveram notas ____________ de 51,8; portanto, a empresa realizará ____________ 40 entrevistas.” Assinale a alternativa que completa correta e sequencialmente a afirmativa anterior.
Alternativas
Q2097896 Estatística
O desvio padrão (σ) é uma medida de variabilidade de dados que tem a vantagem de ter a mesma unidade dos dados originais bem como da média. 
Com base nisso, um determinado experimento que apresentou uma variância (s²) de 100cm² apresentará um desvio padrão de:  
Alternativas
Q2096143 Estatística

Suponha que uma amostra aleatória simples X1, X2, … , Xn, de tamanho n, será observada de uma variável populacional normalmente distribuída com média u e variância σ².


Considere as estatísticas média amostral e soma dos quadrados dos desvios, dadas, respectivamente, por

Imagem associada para resolução da questão

Avalie se as seguintes afirmativas estão corretas:

I. Imagem associada para resolução da questão tem distribuição normal com média μ e variância σ²/n.

II. Imagem associada para resolução da questão e Q são fortemente correlacionadas.

III. Q/σ² tem distribuição qui-quadrado com (n – 1) graus de liberdade.

Está correto o que se afirma em

Alternativas
Q2096140 Estatística

Observe as cinco amostras a seguir:


Imagem associada para resolução da questão

Das cinco, a de menor desvio padrão é a

Alternativas
Q2094340 Estatística

Considerando uma variável aleatória contínua X com a função densidade de probabilidade dada por:

Imagem associada para resolução da questão


julgue o item.



C = 2/25.

Alternativas
Q2094337 Estatística

Considerando uma variável aleatória discreta X com a função de probabilidade dada por

Imagem associada para resolução da questão




julgue o item.



β = 3/4.

Alternativas
Q2086195 Estatística
Considere que X e Y são duas variáveis aleatórias e independentes que representam duas quantidades físicas. Adicionalmente, sabe- -se que V(X) = 1 e V(Y) = 3, em que V representa a variância. Com base nessas informações, o desvio-padrão da variável W = 2X + 7 Y é:
Alternativas
Q2086185 Estatística
Com o objetivo de construir um índice de criminalidade, a técnica multivariada de análise de componentes principais foi utilizada em um banco de dados com 16 variáveis. De acordo com a abordagem que utiliza a matriz de covariância entre as variáveis, os quatro maiores autovalores observados foram iguais a 5; 3; 2; e, 1. O percentual de variação que é explicado por esses autovalores é:
Alternativas
Q2086184 Estatística
A construção de gráficos no software R foi revolucionada com a criação do pacote ggplot2, fruto de uma tese de doutorado. A essência desse pacote é a construção de gráficos camada por camada, deixando os gráficos naturalmente mais bonitos, permitindo uma fácil personalização. As funções do pacote ggplot2 responsáveis por gerar um histograma e um boxplot são, respectivamente:
Alternativas
Q2086178 Estatística
Os dados de tempo de falha, em mil horas, de uma amostra de emissores de laser estão representados no gráfico boxplot a seguir:
Imagem associada para resolução da questão

De acordo com o gráfico boxplot, analise as afirmativas a seguir.
I. Se um emissor de laser dessa amostra for escolhido aleatoriamente, a probabilidade de que ele tenha um tempo de falha maior que 6 mil horas é 0,25.
II. A média do tempo de falha dos emissores de laser dessa amostra é 3 mil horas.
III. A distância interquartílica observada no gráfico é 3 mil horas.
Está correto o que se afirma apenas em  




Alternativas
Q2086177 Estatística
O administrador de uma empresa produtora de bens de consumo de massa levantou um histórico de n anos de vendas, em milhares de unidades, e decidiu modelar o comportamento dessa variável, considerando p variáveis explicativas a partir de um modelo de regressão linear múltipla. Para isso, ajustou o modelo Yi = β0 + β1X1i + ...+ βpXpi + εi, onde i = 1, ... , n e εsão erros independentes e identicamente distribuídos com variância comum σ2 , tais que εi ~ N(0,σ2) A partir dos métodos dos mínimos quadrados, o administrador teve acesso à seguinte tabela de análise de variância, parcialmente preenchida, que contém algumas informações sobre o ajuste do modelo:
Imagem associada para resolução da questão

De acordo com as informações fornecidas pela tabela, a estimativa não viesada para σ é dada por:
Alternativas
Q2086170 Estatística
Na base de dados de um sistema, a média aritmética simples de 1.500 observações é 5. Porém, um analista detectou que os dados faltantes foram erroneamente codificados como 0. Retirando essas observações da base de dados original, a nova média calculada é 6. Dessa forma, a fração de dados faltantes nessa base era de:
Alternativas
Q2086169 Estatística
Em estatística descritiva, o coeficiente de variação é empregado para analisar a dispersão em termos relativos a seu valor médio quando duas ou mais séries de valores apresentam escalas diferentes. Seja C o coeficiente de variação dos dados de desempenho de alunos antes de uma intensa campanha de aprendizagem. Se, após a campanha, o desempenho de todos os alunos dobrou, o novo coeficiente de variação calculado nos dados transformados é:
Alternativas
Q2080026 Estatística
Sabe-se que uma distribuição de dados pode ser simétrica ou assimétrica e que isso poderá contribuir para a análise detalhada do comportamento do estudo estatístico realizado. Assim, considerando uma designação pelo Ministro/Promotor, na qualidade de Auxiliar Judicial para levantar e calcular junto aos dados do sistema penal, considerando o número de prisões reincidentes por determinado delito (aquelas cometidas pela mesma pessoa n vezes) como variável x e a quantidade de vezes que este criminoso fora encarcerado em um determinado período de tempo. Tal levantamento tem por finalidade compreender o comportamento das reincidências de cometimento de crime para entender o comportamento da criminalidade nesta tipologia criminal. Sabedor disto, decidiu-se aplicar o coeficiente de Pearson sobre os dados levantados. Após os cálculos efetuados, assinale a classificação correta da simetria/assimetria dos dados considerados:
Imagem associada para resolução da questão
Alternativas
Q2074394 Estatística

Os gastos com combustível de uma empresa têm distribuição normal com média m e variância v. A gerente da empresa quer instituir um procedimento para detectar consumo muito acima ou abaixo do esperado.


Para isso, precisa construir uma regra para detectar outliers.


Isso é comumente feito estabelecendo limites L = Q1 – 1,5 * IQR e U = Q3 + 1,5 * IQR, onde Q1 e Q3 são o primeiro e terceiro quartis, respectivamente, e IQR = Q3 – Q1 é o intervalo interquartil. Valores fora do intervalo (L, U) são considerados outliers.


Sabendo-se que, para a normal padrão, o quantil 25% é, aproximadamente, – 0,67, podem ser considerados outliers:

Alternativas
Respostas
221: A
222: B
223: B
224: C
225: D
226: A
227: B
228: C
229: C
230: E
231: E
232: B
233: C
234: E
235: A
236: A
237: A
238: B
239: A
240: B