Questões de Concurso
Sobre componentes principais em estatística
Foram encontradas 37 questões
Na análise por PCA, a primeira componente principal de um conjunto de dados representa a

De acordo com os resultados parciais fornecidos na tabela, assinale a afirmativa correta.
Assinale o objetivo principal dessa técnica.
( ) Para utilizar a Regressão logística não são necessárias as suposições de que a amostra tenha urna distribuição normal multivariada e que as matrizes de variância/covariância sejam iguais dento dos grupos. ( ) Tanto a análise discriminante quanto a Regressão Logística têm testes estatísticos diretos, habilidade para incorporar efeitos não lineares, e uma gama extensiva de diagnósticos. ( ) Uma vantagem da regressão logística é que só se precisa saber se um evento (ocorrência ou não, fracasso ou sucesso) aconteceu e podemos dessa forma utilizar um valor dicotômico como variável dependente. O procedimento prediz a estimativa da probabilidade que o evento vai ou não acontecer. ( ) Em vez de minimizar o quadrado dos desvios, a Regressão Logística minimiza a probabilidade de que o evento ocorra.
Assinale a alternativa que indica a sequência correta, de cima para baixo.

Considerando a análise de componentes principais, assinale a alternativa que traz a taxa de variação explicada por autovalor1 e autovalor2.
I. Retirar a multicolinearidade das variáveis pela transformação de um conjunto de variáveis originais intercorrelacionadas em um novo conjunto de variáveis não correlacionadas (componentes principais). II. Reduzir muitas variáveis a eixos ortogonais que representam algumas variáveis, o que permite explicar a variação dos dados de forma decrescente e independente. III. Apresentar pouca sensibilidade a outliers, notadamente quando há duplas ausências.
Está correto o que se afirma em
I. O objetivo principal da ACP é obter variáveis não correlacionadas que retenham a maior parte da estrutura de variabilidade e correlação, a partir das variáveis originais, por meio de transformações lineares para reduzir a dimensão, medida pelo número de variáveis, da matriz de dados. II. A ACP possibilita a compreensão de aspectos do comportamento dos dados difíceis de serem deduzidos a partir das variáveis originais. III. Em geral, a ACP permite que se usem metodologias de análise univariada.
As afirmativas são, respectivamente,

Uma das técnicas de Análise Multivariada é a análise por componentes principais. Dada a matriz de covariâncias do vetor aleatório X' = (X1, X2, X3), os resultados da análise de componentes principais foram os seguintes:
Componente Autovalor Percentagem da variância Percentagem Acumulada
1 5,813 69,095 69,095
2 2,350 27,933 97,028
3 0,25 2,971 100,000
Variável Autovetor 1 Autovetor 2 Autovetor 3
X1 -0,39 0,0 0,89
X2 0,95 0,0 0,40
X3 0,00 1,0 0,0
Considerando o exposto, assinale a alternativa que apresenta a primeira
componente principal.
I. Na análise de componentes principais, quando a distribuição de probabilidade do vetor em estudo é normal multivariada, as componentes principais além de não correlacionadas são também independentes e têm distribuição normal.
II.


III. Na análise fatorial, quando a suposição de ortogonalidade dos fatores não puder ser considerada, pode-se utilizar o recurso da transformação ortogonal dos fatores originais na tentativa de se obter uma estrutura mais simples de ser interpretada.
IV. A análise de agrupamentos trabalha com medidas de similaridade e dissimilaridade, não comportando por isso o uso de variáveis qualitativas.
Está correto o que se afirma APENAS em
I. Na análise fatorial nenhuma variável é definida como dependente ou independente.
II. Na análise de agrupamentos deve haver bastante homogeneidade interna (dentro do agrupamento) em cada um dos agrupamentos resultantes.
III. Na análise de correlação canônica o princípio subjacente é desenvolver uma combinação linear de cada conjunto de variáveis dependentes e independentes para minimizar a correlação entre esses dois conjuntos.
IV. O escalamento multidimensional é uma técnica multivariada apropriada para representar n elementos em um espaço dimensional menor que o original, levando em consideração a similaridade que os elementos têm entre si.
Está correto o que consta APENAS em

I. A análise de regressão múltipla é uma técnica estatística para analisar a relação entre uma única variável independente e várias variáveis dependentes.
II. Uma das medidas de similaridade usadas na Análise de Agrupamentos é a distância de Minkowsky, que tem como caso particular a distância Euclidiana.
III. Na análise discriminante a variável dependente é métrica e a independente é categórica.
IV. Na análise de correlação canônica a ideia básica é resumir a informação de um conjunto de variáveis-resposta em uma combinação linear, sendo que a escolha dos coeficientes dessa combinação é feita tendo como critério a minimização da correlação entre os conjuntos de variáveis respostas.
Está correto o que consta APENAS em
No método de agrupamento por k-médias, a probabilidade de que a configuração inicial seja próxima do resultado final do agrupamento é aproximadamente igual a 1.