Questões de Concurso Sobre análise multivariada em estatística

Foram encontradas 221 questões

Q2568643 Estatística
No que se refere a técnica de análise multivariada de interdependência, assinale a alternativa correta.
Alternativas
Q2567316 Estatística
Na Análise de Agrupamento, os grupos são formados com base em medidas de “proximidade - distância” ou “similaridade” entre os itens que podem ser representados por vetores aleatórios quando suas características são quantitativas. Os agrupamentos podem ser do tipo Aglomerativo Hierárquico e do tipo Não Hierárquico, sendo que Dendrograma do Método Aglomerativo Hierárquico pode ser feito usando 
Alternativas
Q2567300 Estatística

Em uma pesquisa sobre caraterísticas de condenados em uma determinada Vara Federal, uma amostra aleatória de condenados de tamanho n foi tomada e investigou-se nos respectivos processos suas características. Os resultados observados recebiam avaliação dos psicólogos em notas em uma escala até 7 pontos. As notas se referem às características: C1, C2, C3, C4 e C5. Os resultados foram tabulados e a matriz de correlação R construída. Após ser aplicada a Análise Fatorial na matriz R, obtiveram-se os resultados tabelados a seguir:

Análise Fatorial

Imagem associada para resolução da questão


Pesos dos fatores após rotação Varimax 

Imagem associada para resolução da questão

Então, é correto afirmar que 

Alternativas
Q2554361 Estatística
Referente a todos os métodos estatísticos que simultaneamente analisam múltiplas medidas sobre cada indivíduo ou objeto sob investigação. Qualquer análise simultânea de mais de duas variáveis, é o conceito de: 
Alternativas
Q2447363 Estatística
Na análise fatorial, um dos métodos mais conhecidos para a determinação do número m de fatores do modelo é o critério de Kaiser, de acordo com o qual o valor de m é dado pelo número de autovalores
Alternativas
Q2447351 Estatística
Quando se adota que os erros do modelo de regressão linear multivariado seguem uma distribuição normal, após o ajuste do modelo, é preciso verificar tal suposição. A partir dos resíduos, o gráfico utilizado para essa verificação é o gráfico de
Alternativas
Q2445341 Estatística
        A equação y = mx + b, com m = 2,09 e b = 0,257, foi obtida na calibração de um método para a determinação cromatográfica de isoctano em misturas de hidrocarbonetos. Nessa equação, o eixo x apresenta valores de concentração de isoctano, em porcentagem molar, e o eixo y, a área sob o pico cromatográfico, em uma unidade arbitrária.  

Tendo como referência as informações precedentes, julgue o item subsecutivo, a respeito de fundamentos de estatística.


Se uma amostra de hidrocarbonetos contém 5% de isoctano em quantidade de matéria analisada pelo método descrito, então a área sob o pico cromatográfico do isoctano terá valor superior a 10 unidades arbitrárias.

Alternativas
Q2383284 Estatística
Em uma nota técnica publicada em 2022 pelo Ipea, sobre população em situação de rua, foi utilizada a técnica de análise de componente principal (PCA).
Na análise por PCA, a primeira componente principal de um conjunto de dados representa a
Alternativas
Q2382974 Estatística
Considere o texto sobre a teoria locacional de Christaller.

O alemão Walter Christaller (1893-1969) almejou responder a questões que ainda hoje desafiam os pesquisadores: o que explica o tamanho, a distribuição e o número de cidades? Em seu livro Die zentralen Örte in Süddeutschland, Christaller seguiu a tradição geométrica alemã para esboçar as simples regras que permitiriam responder a essa pergunta e chegou à teoria dos lugares centrais. Ele buscou determinar o formato das áreas de mercado em que todos os consumidores são atendidos e, ao mesmo tempo, a distância em relação às firmas é minimizada. Para se chegar à distribuição espacial dos lugares centrais, são necessários três princípios, sendo que um deles é o da minimização das distâncias entre os centros, que faz com que os ofertantes de bens de ordem imediatamente inferior se localizem no ponto médio da linha que une os centros de ordem superior.
MONASTERIO, L.; CAVALCANTE, L. Fundamentos do pensamento econômico regional. In: CRUZ, B. et al. (org.). Economia regional e urbana. Teorias e métodos com ênfase no Brasil. Brasília, DF: Ipea, 2011, p.56. Adaptado.

Nesse texto sobre a teoria dos lugares centrais, é descrito o princípio
Alternativas
Q2382972 Estatística
Considere o texto sobre economias de aglomeração no Brasil.

Quanto maior a escala da urbanização, maiores tendem a ser os ganhos de produtividade das firmas. Do mesmo modo, a maior diversidade de bens e serviços ofertados, de interações sociais e econômicas e de serviços públicos disponíveis para consumo da coletividade torna-se um diferencial de grande significado para a localização empresarial. Para o Brasil, no processo de desconcentração produtiva, mostrou-se que a localização de firmas industriais adquiriu um comportamento fortemente associado a economias de aglomeração dadas pelo estoque de infraestrutura e mão de obra qualificada: o tecido industrial tornou-se concentrado — e desconcentrou concentradamente — em uma grande porção do território entre o Sul e o Sudeste. Consideradas, de um lado, as motivações e lógicas do setor privado e os estímulos do mercado mundial e do território inercial do desenvolvimento brasileiro e, de outro lado, as motivações e os esforços governamentais, em sentido amplo, para atuação sobre novas geografias econômicas nacionais, identificam-se cinco tipos preferenciais de territórios predominantemente impactados e redefinidos pela potência das forças em atuação.
MONTEIRO NETO, A.; SILVA, R.; SEVERIAN, D. O território das atividades industriais no Brasil: a força das economias de aglomeração e urbanização. In: MONTEIRO NETO, A. (org.). Brasil, Brasis: reconfigurações territoriais da indústria no século XXI. Brasília, DF: Ipea, 2021, p. 256-258. Adaptado.

Na tipologia mencionada acima, encontram-se rearranjos territoriais que se prestam à análise das formas de aglomeração e os que concorrem para a desaglomeração.
Considerando-se especificamente os vetores que levam à concentração produtiva, identificam-se territórios predominantemente impactados e (re)definidos por
Alternativas
Q2353403 Estatística
A respeito da análise de conglomerados, analise as afirmativas a seguir.
I. Na execução do algoritmo K-means, é possível que a alocação de observações aos clusters não mude entre duas iterações sucessivas.
II. O uso de duas medidas de similaridade distintas pode produzir dois dendrogramas diferentes ao se aplicar um algoritmo de agrupamento aglomerativo para o mesmo conjunto de dados.
III. Em uma análise envolvendo duas variáveis, considere que, após a primeira iteração do algoritmo K-Means aplicado para agrupar sete observações em três clusters, C1, C2 e C3, obteve-se a seguinte configuração: C1={(2,2), (4,4), (6,6)}; C2={(0,4), (4,0)} e C3={(5,5), (9,9)}. Então, os respectivos centroides que darão seguimento à próxima iteração serão C1=(4,4), C2=(2,2) e C3=(7,7).
Está correto o que se afirma em
Alternativas
Q2353399 Estatística
Considere a realização de uma pesquisa exploratória para estudar o comportamento de indivíduos em relação ao hábito de se socializarem. Vinte e uma pessoas responderam a um conjunto de sete variáveis relacionadas ao tema. A escala de medida foi de 1 a 5, onde 1 representava a discordância total e 5 representava concordância total quanto à afirmação expressa na variável. Foi realizada uma análise fatorial ortogonal com extração das cargas fatoriais pelo método de componentes principais baseado na matriz de correlação das sete variáveis disponíveis.

Imagem associada para resolução da questão


De acordo com os resultados parciais fornecidos na tabela, assinale a afirmativa correta.
Alternativas
Q2341836 Estatística
A análise de componentes principais é utilizada para
Alternativas
Q2277935 Estatística
Sobre técnicas de agrupamento (clusterização), assinale a alternativa correta.
Alternativas
Q2164555 Estatística
Considere que um índice de desempenho acadêmico de 120 estudantes de uma instituição foi construído através da análise de componentes principais, tomando como base os valores das suas notas em quatro disciplinas X = (X1, X2, X3, X4). Os autovalores extraídos da matriz de covariâncias foram, respectivamente, iguais a 13, 4, 2, 1 e o primeiro autovetor normalizado foi e1 = (0,5; 0,2; 0,5; 0,7). O percentual de explicação da primeira componente principal e o valor do índice de desempenho de um estudante com notas X = (60, 70, 85, 80) são, respectivamente:
Alternativas
Q2164544 Estatística
A similaridade é um critério para medir a distância entre dois vetores, sendo um conceito essencial na análise de agrupamentos. A distância Euclidiana está entre as medidas de similaridade mais comuns. Considere que a variável X represente a idade (em anos) e que a variável Y represente a média do rendimento semestral global (medido numa escala de 0 a 10) de estudantes de um Instituto Federal de Educação. A tabela a seguir apresenta dados observados para as variáveis X e Y para três estudantes desse Instituto:
Estudante       Idade (X)    Rendimento (Y)    1                          21                   7    2                          22                   8    3                          18                   6
A distância Euclidiana para esse conjunto de dados é igual a:
Alternativas
Q2132858 Estatística

    Em uma análise dos resultados das urnas eleitorais, decidiu-se verificar quais variáveis estão mais relacionadas ao voto em candidatos de direita ou de esquerda. Os votos para os candidatos de direita e de esquerda foram analisados em separado para as 27 unidades da federação (UF), tendo como variáveis explicativas a idade (x1) e os anos de estudo (x2) dos eleitores. Em cada UF, foram analisados os votos de y eleitores e as estatísticas descritivas das variáveis utilizadas são mostradas na tabela a seguir.


00_84 - 92 .png (405×472)


Com base nessas informações, julgue o próximo item.


Em média, os candidatos de esquerda receberam mais votos que os candidatos da direita.

Alternativas
Q2098364 Estatística
Em uma análise fatorial envolvendo três variáveis, foi encontrada a seguinte matriz de carga fatorial com dois componentes:


A soma das comunalidades das três variáveis é dada por:
Alternativas
Q2096289 Estatística
A Análise de Componentes Principais (PCA) é uma técnica de transformação de dados que tem como objetivo encontrar as direções de maior variação nos dados, geralmente representadas pelos chamados componentes principais, e gerar novas representações dos dados.
Assinale o objetivo principal dessa técnica. 
Alternativas
Q2086179 Estatística
Após a extração dos fatores em uma análise fatorial, pode ser calculado o grau de adaptação das variáveis aos fatores por meio das cargas fatoriais. Normalmente, o que acontece é que a maior parte das variáveis tem cargas altas no fator mais importante e cargas baixas nos outros fatores, tornando a interpretação mais difícil. Nesse sentido, a técnica de rotação de fatores é utilizada para atingir uma melhor distinção entre os fatores. Nesse contexto, analise as afirmativas a seguir.
I. A rotação quartimax visa maximizar a dispersão da carga dos fatores de uma variável por todos os fatores, geralmente acarretando em muitas variáveis com cargas altas em um único fator.
II. A rotação varimax facilita a interpretação das cargas fatoriais.
III. A rotação promax é um método rápido desenvolvido para bancos de dados muito grandes.
É correto o que se afirma em
Alternativas
Respostas
81: D
82: D
83: A
84: C
85: B
86: C
87: C
88: D
89: D
90: C
91: A
92: A
93: B
94: C
95: C
96: A
97: E
98: B
99: B
100: A