Questões de Concurso
Sobre componentes principais em estatística
Foram encontradas 37 questões
Com base nessas informações, julgue os itens a seguir.
Com base nessas informações, julgue os itens a seguir.
Tabela 5. Dados da questão 53 Variável Fator 1 Fator 2 X1padronizada 0,80 0,10 X2 padronizada 0,20 0,76
Nesse caso, pode-se dizer que a correlação estimada, pelo modelo de análise fatorial, entre as variáveis X1 e X2 é aproximadamente igual a
Com base nessas informações, assinale a alternativa que completa corretamente as lacunas da frase a seguir.
A matriz Σpxp é ________ e as variâncias das (p-q) componentes principais são ______.
I. O primeiro componente principal, Z1 é dado pela combinação linear das variáveis originais X = [ X1 X2, ..., Xp] com maior variância possível.
II. Todos os componentes principais subsequentes são escolhidos para que não sejam correlacionados a todos os componentes principais anteriores.
III. Em razão de a análise de componentes principais buscar maximizar a variância, ela pode ser altamente sensível às diferenças de escala entre variáveis. Assim, é uma boa ideia padronizar os dados e representá-los por Xs.
IV. A solução para o problema dos componentes principais é obtida realizando-se uma decomposição de autovalor da matriz de correlação. Cada autovetor, indicado por Ui, representa a direção de um desses eixos principais. O vetor u controla os pesos usados para formar a combinação linear de Xs, que resulta em zi= Xs.Ui.
VI. No caso mais geral, só faz sentido utilizar a análise dos componentes principais quando os dados não são independentes. Barlett fornece um teste de qui- quadrado para determinar a esfericidade dos dados, 2 representado por X 2 = - [ n - 1 + (2p + 6)/5]ln | R|, com 2 (p2 - p)/2 graus de liberdade, onde p é o número de variáveis, n é o tamanho da amostra, e R é a matriz de correlação.
Dentre as seis afirmações dadas, quantas são falsas?
Nessa situação, considerando-se p =10, é correto afirmar que ρ < 0,75.
I. Na análise de componentes principais a informação contida em um vetor aleatório
p-dimensional é substituída pela informação contida num vetor aleatório q-dimensional
(q < p), de variáveis aleatórias correlacionadas, denominadas pelo nome de componentes principais.
II. O escalonamento multidimensional é uma técnica matemática apropriada para representar n elementos num espaço de dimensão menor que o original, levando-se em consideração a similaridade que os elementos têm entre si.
III. Na análise de agrupamentos nenhuma variável é definida como dependente ou independente.
Dentre as afirmações acima são verdadeiras APENAS
I. Os componentes principais amostrais são combinações lineares das variáveis mensuradas que maximizam a variação total da amostra e que são mutuamente ortogonais.
II. O algoritmo das k-médias é um tipo de agrupamento não hierárquico que particiona n objetos em k grupos.
III. O método de correlação canônica analisa combinações não lineares das variáveis em dois grupos para determinar as combinações que possuem a maior correlação.
Assinale
Para orientar os investimentos em educação em certo município, um analista foi contratado para criar um ranking das escolas públicas desse município. Para cada escola, as variáveis disponíveis são a quantidade de turmas, a quantidade de alunos, a quantidade de professores, a nota da Prova Brasil e a área do terreno.
A partir dessa situação, julgue o item.
Em uma análise multivariada, as variáveis X1, X2 e X3 possuem
matriz de covariâncias dada por, e as seguintes componentes principais:
C1 = 0,7071X1 + 0,7071X2;
C2 = 0,7071X1 – 0,7071X2;
C3 = X3.
Com base nessas informações, julgue o item.
principais.

matriz de correlação:
sdmed salário tempo idade
sdmed 1,00000000 0,93303483 0,6038786 -0,01126878salário 0,93303483 1,00000000 0,5845924 0,06371626
tempo 0,60387857 0,58459235 1,0000000 0,49093437idade -0,01126878 0,06371626 0,4909344 1,00000000
comp. 1 comp. 2 comp. 3 comp. 4
padrão 1,576085 1,0866016 0,52563869 0,24281048
proporção davariância 0,621011 0,2951758 0,06907401 0,01473923
proporçãoacumulada 0,621011 0,9161868 0,98526077 1,00000000
comp.1 comp.2 comp.3 comp.4
sdmed 0,582 0,322 0,145 0,733salário 0,584 0,271 0,390 -0,659
tempo 0,532 -0,338 -0,767 -0,122idade 0,196 -0,842 0,488 0,117

matriz de correlação:
sdmed salário tempo idade
sdmed 1,00000000 0,93303483 0,6038786 -0,01126878salário 0,93303483 1,00000000 0,5845924 0,06371626
tempo 0,60387857 0,58459235 1,0000000 0,49093437idade -0,01126878 0,06371626 0,4909344 1,00000000
comp. 1 comp. 2 comp. 3 comp. 4
padrão 1,576085 1,0866016 0,52563869 0,24281048
proporção davariância 0,621011 0,2951758 0,06907401 0,01473923
proporçãoacumulada 0,621011 0,9161868 0,98526077 1,00000000
comp.1 comp.2 comp.3 comp.4
sdmed 0,582 0,322 0,145 0,733salário 0,584 0,271 0,390 -0,659
tempo 0,532 -0,338 -0,767 -0,122idade 0,196 -0,842 0,488 0,117
I. Na análise de correspondência usa-se como medida de similaridade a distância Euclidiana média.
II. O objetivo principal da análise de componentes principais é o de explicar a estrutura de variância e covariância de um vetor aleatório, composto por n variáveis aleatórias, através da construção de combinações lineares das variáveis originais.
III. O escalonamento dimensional é uma técnica matemática apropriada para representar graficamente n elementos num espaço de dimensão menor que o original, tendo-se em consideração a distância ou similaridade que os elementos têm entre si.
IV. Na análise de agrupamentos, uma medida de similaridade que pode ser utilizada é a distância Euclidiana.
Dentre essas afirmações citadas são verdadeiras SOMENTE
I. Na análise de componentes principais a obtenção das componentes principais envolve a decomposição da matriz de covariâncias do vetor aleatório de interesse.
II. Na análise discriminante não é necessário que os grupos nos quais cada elemento amostral pode ser classificado sejam conhecidos à priori.
III. O escalonamento dimensional gera uma medida de ajuste denominada Stress que quanto mais próxima de 1 estiver melhor será o ajuste.
IV. Na análise de agrupamentos, para que se possa proceder ao agrupamento de elementos, é necessário se decidir à priori a medida de similaridade ou dissimilaridade que será usada.
Dentre essas afirmações citadas são verdadeiras SOMENTE