Questões de Concurso
Sobre componentes principais em estatística
Foram encontradas 49 questões
I. Retirar a multicolinearidade das variáveis pela transformação de um conjunto de variáveis originais intercorrelacionadas em um novo conjunto de variáveis não correlacionadas (componentes principais). II. Reduzir muitas variáveis a eixos ortogonais que representam algumas variáveis, o que permite explicar a variação dos dados de forma decrescente e independente. III. Apresentar pouca sensibilidade a outliers, notadamente quando há duplas ausências.
Está correto o que se afirma em
I. O objetivo principal da ACP é obter variáveis não correlacionadas que retenham a maior parte da estrutura de variabilidade e correlação, a partir das variáveis originais, por meio de transformações lineares para reduzir a dimensão, medida pelo número de variáveis, da matriz de dados. II. A ACP possibilita a compreensão de aspectos do comportamento dos dados difíceis de serem deduzidos a partir das variáveis originais. III. Em geral, a ACP permite que se usem metodologias de análise univariada.
As afirmativas são, respectivamente,
seja a matriz de correlação de duas variáveis, X1 e X2. Para p >0, o
maior autovalor e o primeiro componente principal serão, respectivamente, Uma das técnicas de Análise Multivariada é a análise por componentes principais. Dada a matriz de covariâncias do vetor aleatório X' = (X1, X2, X3), os resultados da análise de componentes principais foram os seguintes:
Componente Autovalor Percentagem da variância Percentagem Acumulada
1 5,813 69,095 69,095
2 2,350 27,933 97,028
3 0,25 2,971 100,000
Variável Autovetor 1 Autovetor 2 Autovetor 3
X1 -0,39 0,0 0,89
X2 0,95 0,0 0,40
X3 0,00 1,0 0,0
Considerando o exposto, assinale a alternativa que apresenta a primeira
componente principal.
I. Na análise de componentes principais, quando a distribuição de probabilidade do vetor em estudo é normal multivariada, as componentes principais além de não correlacionadas são também independentes e têm distribuição normal.
II.
é a matriz de covariâncias do vetor aleatório X de dimensão (2X1), então a matriz de correlações de X é P = 
III. Na análise fatorial, quando a suposição de ortogonalidade dos fatores não puder ser considerada, pode-se utilizar o recurso da transformação ortogonal dos fatores originais na tentativa de se obter uma estrutura mais simples de ser interpretada.
IV. A análise de agrupamentos trabalha com medidas de similaridade e dissimilaridade, não comportando por isso o uso de variáveis qualitativas.
Está correto o que se afirma APENAS em
I. Na análise fatorial nenhuma variável é definida como dependente ou independente.
II. Na análise de agrupamentos deve haver bastante homogeneidade interna (dentro do agrupamento) em cada um dos agrupamentos resultantes.
III. Na análise de correlação canônica o princípio subjacente é desenvolver uma combinação linear de cada conjunto de variáveis dependentes e independentes para minimizar a correlação entre esses dois conjuntos.
IV. O escalamento multidimensional é uma técnica multivariada apropriada para representar n elementos em um espaço dimensional menor que o original, levando em consideração a similaridade que os elementos têm entre si.
Está correto o que consta APENAS em
I. A análise de regressão múltipla é uma técnica estatística para analisar a relação entre uma única variável independente e várias variáveis dependentes.
II. Uma das medidas de similaridade usadas na Análise de Agrupamentos é a distância de Minkowsky, que tem como caso particular a distância Euclidiana.
III. Na análise discriminante a variável dependente é métrica e a independente é categórica.
IV. Na análise de correlação canônica a ideia básica é resumir a informação de um conjunto de variáveis-resposta em uma combinação linear, sendo que a escolha dos coeficientes dessa combinação é feita tendo como critério a minimização da correlação entre os conjuntos de variáveis respostas.
Está correto o que consta APENAS em
No método de agrupamento por k-médias, a probabilidade de que a configuração inicial seja próxima do resultado final do agrupamento é aproximadamente igual a 1.
Com base nessas informações, julgue os itens a seguir.
Com base nessas informações, julgue os itens a seguir.
Tabela 5. Dados da questão 53 Variável Fator 1 Fator 2 X1padronizada 0,80 0,10 X2 padronizada 0,20 0,76
Nesse caso, pode-se dizer que a correlação estimada, pelo modelo de análise fatorial, entre as variáveis X1 e X2 é aproximadamente igual a
Com base nessas informações, assinale a alternativa que completa corretamente as lacunas da frase a seguir.
A matriz Σpxp é ________ e as variâncias das (p-q) componentes principais são ______.
I. O primeiro componente principal, Z1 é dado pela combinação linear das variáveis originais X = [ X1 X2, ..., Xp] com maior variância possível.
II. Todos os componentes principais subsequentes são escolhidos para que não sejam correlacionados a todos os componentes principais anteriores.
III. Em razão de a análise de componentes principais buscar maximizar a variância, ela pode ser altamente sensível às diferenças de escala entre variáveis. Assim, é uma boa ideia padronizar os dados e representá-los por Xs.
IV. A solução para o problema dos componentes principais é obtida realizando-se uma decomposição de autovalor da matriz de correlação. Cada autovetor, indicado por Ui, representa a direção de um desses eixos principais. O vetor u controla os pesos usados para formar a combinação linear de Xs, que resulta em zi= Xs.Ui.
VI. No caso mais geral, só faz sentido utilizar a análise dos componentes principais quando os dados não são independentes. Barlett fornece um teste de qui- quadrado para determinar a esfericidade dos dados, 2 representado por X 2 = - [ n - 1 + (2p + 6)/5]ln | R|, com 2 (p2 - p)/2 graus de liberdade, onde p é o número de variáveis, n é o tamanho da amostra, e R é a matriz de correlação.
Dentre as seis afirmações dadas, quantas são falsas?
Nessa situação, considerando-se p =10, é correto afirmar que ρ < 0,75.
I. Na análise de componentes principais a informação contida em um vetor aleatório
p-dimensional é substituída pela informação contida num vetor aleatório q-dimensional
(q < p), de variáveis aleatórias correlacionadas, denominadas pelo nome de componentes principais.
II. O escalonamento multidimensional é uma técnica matemática apropriada para representar n elementos num espaço de dimensão menor que o original, levando-se em consideração a similaridade que os elementos têm entre si.
III. Na análise de agrupamentos nenhuma variável é definida como dependente ou independente.
Dentre as afirmações acima são verdadeiras APENAS