Questões da Prova CONSULPLAN - 2013 - TRE-MG - Analista Judiciário - Estatística

Foram encontradas 57 questões

Resolva questões gratuitamente!

Junte-se a mais de 4 milhões de concurseiros!

Q452954 Estatística
O modelo de regressão logística é um caso particular de um modelo linear generalizado em que o componente aleatório tem distribuição Bernoulli e a função de ligação é a logito. Diante do exposto, marque V para as afirmativas verdadeiras e F para as falsas.

( ) Para uma variável explicativa numérica, o modelo logístico tem uma forma linear para o logito da probabilidade: imagem-077.jpg, ou seja, p(x) aumenta ou diminui como uma função linear de x.
( ) A chance ou odds é a razão entre as probabilidades de sucesso e fracasso e pode ser expressa como eα (eß ) x . Quando a variável explicativa aumenta em uma unidade, a chance é aumentada multiplicativamente por ß.
( ) Para a avaliação do modelo de regressão com variáveis explicativas numéricas pode-se utilizar a estatística X2 de Pearson ou a estatística G2 do teste da razão de verossimilhança dadas, respectivamente, por:

imagem-078.jpg

( ) Para a análise de resíduos de um modelo de regressão logística com variáveis explicativas numéricas pode-se utilizar o resíduo de Pearson ou o resíduo ajustado de Pearson, dados, respectivamente, por:

imagem-079.jpg

( ) O modelo de regressão logística multicategorizada é uma generalização do modelo de regressão logística, onde a variável resposta assume mais de duas categorias. Quando as categorias são nominais, escolhe-se uma como sendo a base para se construir as chances e fazer as análises necessárias. No caso de categorias ordinais, a ordenação pode ser incorporada ao modelo na forma de probabilidades acumuladas, obtendo-se, então, o modelo logito acumulativo.

A sequência está correta em
Alternativas
Q452952 Estatística
O modelo de análise fatorial representa a estrutura de cova- riância entre muitas variáveis aleatórias imagem-071.jpg, através de poucas variáveis não observáveis F´ = [imagem-072.jpg imagem-073.jpg ] também conhecidas como fatores, construtos ou fatores comuns. Sendo E(X) = µ e V(X) = S, o modelo fatorial é expresso por X – µ = LF + e. A matriz imagem-074.jpg é conhecida como matriz das cargas fatoriais e seus elementos, imagem-076.jpg , carga da variável i no fator j e as variáveis aleatórias F e em + p são não observáveis. Analise as afirmativas, marque V para as verdadeiras e F para as falsas.

( ) No modelo fatorial ortogonal, as variáveis não observáveis F e e são independentes, E(F) = 0, V(F) = E(F´F) = I, E(e) = 0, V(e) = E(e´e) = ?. A matriz ? é não diagonal, V(X) = S = L´L + ? e Cov (X, F) = L.
( ) Um método de estimação para as cargas do modelo fatorial ortogonal é através de componentes principais, onde se utiliza a decomposição espectral da matriz S.
( ) Para se utilizar o método de máxima verossimilhança para estimar as cargas, é acrescida a suposição de que F e e têm distribuição normal multivariada. As comunalidades (elementos da diagonal LL´) têm como estimadores a proporção da variância total estimada pelo particular fator.
( ) Para melhorar a explicação do modelo fatorial, sem alterar a ortogonalidade dos fatores, muitas vezes, usa- se uma transformação ortogonal das cargas fatoriais, que, consequentemente, transforma os fatores. Esse procedimento é conhecido como rotação fatorial.
( ) Dependendo da natureza dos dados, os fatores não precisam ser ortogonais. Assim, para melhorar a explicação do modelo fatorial, pode-se utilizar a rotação oblíqua, onde cada variável é expressa em termos de um número máximo de fatores.
A sequência está correta em
Alternativas
Q452951 Estatística
O modelo de componentes principais é utilizado para representar a estrutura de variância-covariância em função de um número reduzido de combinações lineares das variáveis originais, com o objetivo de se ter uma redução de dados e uma melhor interpretação destes. Para o vetor aleatório imagem-050.jpgcom matriz de covariância S e autovalores iguais a imagem-051.jpg, e as combinações lineares:

imagem-052.jpg

O modelo de componentes principais corresponde às combinações lineares não correlacionadas imagem-053.jpg com vetores de coeficientes imagem-054.jpg de comprimento unitário, que apresentam as maiores variâncias Var imagem-055.jpg. Diante do exposto, é correto afirmar que


I. o primeiro componente principal é a combinação linear imagem-056.jpg que maximiza Var imagem-058.jpg sujeito a imagem-059.jpg = 1.

II. o i-ésimo componente principal é a combinação linear imagem-060.jpg que maximiza Var imagem-057.jpg = 1 e Cov (imagem-062.jpg, imagem-064.jpg) = 0, para k < i.

III. sendo imagem-065.jpg os autovalores e ei os autovetores de S, o i-ésimo componente principal é dado por imagem-066.jpg + imagem-067.jpg, onde i = 1, ··· p.

IV. Var imagem-069.jpg= 0, para i = 1,2, ···, p e i ≠ k.

V. a proporção da variância total devido ao k-ésimo componente principal é dada por imagem-070.jpg para k = 1, ···, p.

Estão corretas apenas as afirmativas
Alternativas
Q452950 Estatística
“A análise de resíduos de um modelo de regressão linear múltipla pode ser utilizada para verificar se o modelo se adequa aos dados. Nesse sentido, gráficos e testes ajudam a identificar discrepâncias entre os valores observados da variável resposta e os valores preditos pelo modelo.” De acordo com o trecho anterior, marque V para as afirmativas verdadeiras e F para as falsas.
( ) Quando os pontos do diagrama de dispersão do resíduo padronizado versus variável explicativa apresentar uma tendência, a inclusão do logaritmo da variável explicativa pode melhorar o modelo.
( ) Quando os pontos do diagrama de dispersão do resíduo versus variável omitida no modelo apresentar uma tendência linear, a inclusão da variável omitida pode melhorar o modelo.
( ) Quando o desenho esquemático (boxplot) dos resíduos padronizados apresentar observações além dos limites superior ou inferior, existe uma forte indicação da presença de outliers que devem ser investigados.
( ) Quando o desenho esquemático dos resíduos tem a distância entre a mediana e o primeiro quartil e a distância entre a mediana e o terceiro quartil bem distintas, existe uma forte indicação de que a distribuição das observações são assimétricas e o componente aleatório do modelo pode não ter distribuição normal.
( ) A suposição de homocedasticidade dos resíduos pode ser avaliada através de: teste de Levéne; teste de Brown & Forsythe; gráfico de resíduos versus valores preditos pelo modelo; gráfico do resíduo versus cada uma das variáveis incluídas no modelo.
A sequência está correta em
Alternativas
Q452948 Estatística
Em uma população finita de tamanho N, onde existem k indivíduos com uma característica de interesse, ao se selecionar uma amostra aleatória de tamanho n sem reposição, o número de indivíduos com a característica na amostra (R) é uma variável aleatória com distribuição hipergeométrica. A probabilidade de se ter exatamente r indivíduos na amostra com a característica de interesse é dada por

imagem-049.jpg, onde max (0, n – N + k) = r = min (k, n).

Analise.

I. Para N = 100, k = 20, n = 10 e r = 3, E(R) = 2 e Var(R) = 144/99.

II. Para N = 100, k = 20, n = 5 e r = 3, E(R) = 1 e Var(R) = 8/10.

III. Para N = 10000, k = 2000, n = 100 e r = 3, E(R) = 20 e Var(R) = 15,84.

IV. Para N = 10000, k = 1000, n = 100 e r = 3, E(R) = 10 e Var(R) ˜ 9.

V. Para N = 10000, k = 2000, n = 10 e r = 0, P(R = 0) ˜ 0,1074.

Estão corretas apenas as alternativas
Alternativas
Respostas
11: D
12: C
13: D
14: E
15: D