Questões de Concurso Sobre componentes principais em estatística

Foram encontradas 49 questões

Q3932862 Estatística

No que se refere aos processos de ETL (extract, transform, load) e a técnicas de pré-processamento de dados para classificação e visualização de dados, julgue o próximo item.


A análise PCA (análise de componentes principais) é utilizada para simplificar os dados e reduzir o ruído, pois tende a equilibrar as dimensões que têm valores mais extremos (outliers). 

Alternativas
Q3280859 Estatística
        Um analista realizou um estudo para investigar os fatores que mais influenciam a produtividade de diferentes cultivos em diversas regiões do país. Para isso, ele coletou informações de 150 propriedades rurais referentes a sete variáveis quantitativas, X1, X2,..., X7. Como essas variáveis possuem escalas e unidades de medidas diferentes, esse analista efetuou uma análise de componentes principais com base na matriz de correlação dos dados.

Considerando que o quadro acima mostra os resultados referentes às três primeiras componentes principais, julgue o item a seguir. 


O desvio padrão da segunda componente principal é igual a 1,5.

Alternativas
Q3280858 Estatística
        Um analista realizou um estudo para investigar os fatores que mais influenciam a produtividade de diferentes cultivos em diversas regiões do país. Para isso, ele coletou informações de 150 propriedades rurais referentes a sete variáveis quantitativas, X1, X2,..., X7. Como essas variáveis possuem escalas e unidades de medidas diferentes, esse analista efetuou uma análise de componentes principais com base na matriz de correlação dos dados.

Considerando que o quadro acima mostra os resultados referentes às três primeiras componentes principais, julgue o item a seguir. 


A carga fatorial da variável X5, em relação à segunda componente principal é igual a 0,16.

Alternativas
Q3280857 Estatística
        Um analista realizou um estudo para investigar os fatores que mais influenciam a produtividade de diferentes cultivos em diversas regiões do país. Para isso, ele coletou informações de 150 propriedades rurais referentes a sete variáveis quantitativas, X1, X2,..., X7. Como essas variáveis possuem escalas e unidades de medidas diferentes, esse analista efetuou uma análise de componentes principais com base na matriz de correlação dos dados.

Considerando que o quadro acima mostra os resultados referentes às três primeiras componentes principais, julgue o item a seguir. 


O percentual da variação explicada pelas três primeiras componentes principais é superior a 80%.

Alternativas
Q3280856 Estatística
        Um analista realizou um estudo para investigar os fatores que mais influenciam a produtividade de diferentes cultivos em diversas regiões do país. Para isso, ele coletou informações de 150 propriedades rurais referentes a sete variáveis quantitativas, X1, X2,..., X7. Como essas variáveis possuem escalas e unidades de medidas diferentes, esse analista efetuou uma análise de componentes principais com base na matriz de correlação dos dados.

Considerando que o quadro acima mostra os resultados referentes às três primeiras componentes principais, julgue o item a seguir. 


O primeiro autovetor associado ao maior autovalor define a direção da primeira componente principal (CP1), e suas coordenadas indicam as combinações lineares das variáveis originais que maximizam a variância total dos dados.

Alternativas
Q3280855 Estatística
        Um analista realizou um estudo para investigar os fatores que mais influenciam a produtividade de diferentes cultivos em diversas regiões do país. Para isso, ele coletou informações de 150 propriedades rurais referentes a sete variáveis quantitativas, X1, X2,..., X7. Como essas variáveis possuem escalas e unidades de medidas diferentes, esse analista efetuou uma análise de componentes principais com base na matriz de correlação dos dados.

Considerando que o quadro acima mostra os resultados referentes às três primeiras componentes principais, julgue o item a seguir. 


Considerando cargas fatoriais superiores a 0,4, conclui-se que CP3 está diretamente relacionada com as variáveis X2 e X6.

Alternativas
Q3280838 Estatística
        Um pesquisador organizou um conjunto de dados contendo 100 observações de 10 variáveis relacionadas à qualidade do ar em uma cidade. As variáveis incluem medições de poluentes atmosféricos, como CO, NO2, SO2, e fatores meteorológicos, como temperatura, umidade, e velocidade do vento. Para entender a estrutura dos dados e reduzir sua dimensionalidade, esse pesquisador realizou algumas análises e concluiu que:

• as três componentes principais explicam 70% da variância total dos dados;

• as variáveis CO, NO2 e SO2 apresentam altas cargas nas duas primeiras componentes principais;

• há três clusters proeminentes, que descrevem diferentes padrões da qualidade do ar em função dos níveis de poluentes e condições meteorológicas;

• é possível prever, com boa acurácia, a qualidade do ar como boa, moderada ou ruim com base nos níveis de poluentes e em fatores meteorológicos.

A partir dessa situação hipotética, julgue o seguinte item.


Na análise das componentes principais, os elementos dos autovetores representam a associação entre as variáveis originais e as componentes, o que ajuda a interpretar quais variáveis contribuem mais para cada componente.

Alternativas
Q3280836 Estatística
        Um pesquisador organizou um conjunto de dados contendo 100 observações de 10 variáveis relacionadas à qualidade do ar em uma cidade. As variáveis incluem medições de poluentes atmosféricos, como CO, NO2, SO2, e fatores meteorológicos, como temperatura, umidade, e velocidade do vento. Para entender a estrutura dos dados e reduzir sua dimensionalidade, esse pesquisador realizou algumas análises e concluiu que:

• as três componentes principais explicam 70% da variância total dos dados;

• as variáveis CO, NO2 e SO2 apresentam altas cargas nas duas primeiras componentes principais;

• há três clusters proeminentes, que descrevem diferentes padrões da qualidade do ar em função dos níveis de poluentes e condições meteorológicas;

• é possível prever, com boa acurácia, a qualidade do ar como boa, moderada ou ruim com base nos níveis de poluentes e em fatores meteorológicos.

A partir dessa situação hipotética, julgue o seguinte item.


Na análise de componentes principais, o percentual da variância total explicada (70%) é dado pela razão entre o número de componentes explicativas (3) pela quantidade de variáveis presentes na base de dados (10). 

Alternativas
Q3257791 Estatística
        Uma análise de componentes principais envolvendo 5 variáveis métricas proporcionou os seguintes resultados para a extração dos fatores componentes.

Com base nessas informações, julgue o próximo item.


A soma das variâncias das 5 variáveis métricas envolvidas no estudo foi igual ou inferior a 30.

Alternativas
Q3257790 Estatística
        Uma análise de componentes principais envolvendo 5 variáveis métricas proporcionou os seguintes resultados para a extração dos fatores componentes.

Com base nessas informações, julgue o próximo item.


Os autovalores representam as cargas fatoriais das componentes principais.

Alternativas
Q3257789 Estatística
        Uma análise de componentes principais envolvendo 5 variáveis métricas proporcionou os seguintes resultados para a extração dos fatores componentes.

Com base nessas informações, julgue o próximo item.


A primeira componente principal explica 44% da variação total dos dados.

Alternativas
Q3257787 Estatística
        Uma análise de componentes principais envolvendo 5 variáveis métricas proporcionou os seguintes resultados para a extração dos fatores componentes.

Com base nessas informações, julgue o próximo item.


O desvio padrão da terceira componente principal é igual a 2.

Alternativas
Q2568645 Estatística
Técnica de análise multivariada que permite estabelecer a probabilidade de ocorrência de determinado evento para situações em que a variável dependente é qualitativa e de natureza dicotômica. Pode ser utilizada mesmo quando alguns dos pressupostos da análise discriminante não forem atendidos. Com base nesse conceito, assinale a alternativa correta.
Alternativas
Q2383284 Estatística
Em uma nota técnica publicada em 2022 pelo Ipea, sobre população em situação de rua, foi utilizada a técnica de análise de componente principal (PCA).
Na análise por PCA, a primeira componente principal de um conjunto de dados representa a
Alternativas
Q2353399 Estatística
Considere a realização de uma pesquisa exploratória para estudar o comportamento de indivíduos em relação ao hábito de se socializarem. Vinte e uma pessoas responderam a um conjunto de sete variáveis relacionadas ao tema. A escala de medida foi de 1 a 5, onde 1 representava a discordância total e 5 representava concordância total quanto à afirmação expressa na variável. Foi realizada uma análise fatorial ortogonal com extração das cargas fatoriais pelo método de componentes principais baseado na matriz de correlação das sete variáveis disponíveis.

Imagem associada para resolução da questão


De acordo com os resultados parciais fornecidos na tabela, assinale a afirmativa correta.
Alternativas
Q2341836 Estatística
A análise de componentes principais é utilizada para
Alternativas
Q2164555 Estatística
Considere que um índice de desempenho acadêmico de 120 estudantes de uma instituição foi construído através da análise de componentes principais, tomando como base os valores das suas notas em quatro disciplinas X = (X1, X2, X3, X4). Os autovalores extraídos da matriz de covariâncias foram, respectivamente, iguais a 13, 4, 2, 1 e o primeiro autovetor normalizado foi e1 = (0,5; 0,2; 0,5; 0,7). O percentual de explicação da primeira componente principal e o valor do índice de desempenho de um estudante com notas X = (60, 70, 85, 80) são, respectivamente:
Alternativas
Q2096289 Estatística
A Análise de Componentes Principais (PCA) é uma técnica de transformação de dados que tem como objetivo encontrar as direções de maior variação nos dados, geralmente representadas pelos chamados componentes principais, e gerar novas representações dos dados.
Assinale o objetivo principal dessa técnica. 
Alternativas
Ano: 2023 Banca: FEPESE Órgão: EPAGRI Prova: FEPESE - 2023 - EPAGRI - Estatístico |
Q2073939 Estatística
Identifique abaixo as afirmativas verdadeiras ( V ) e as falsas ( F ) sobre a Regressão Logística.
( ) Para utilizar a Regressão logística não são necessárias as suposições de que a amostra tenha urna distribuição normal multivariada e que as matrizes de variância/covariância sejam iguais dento dos grupos. ( ) Tanto a análise discriminante quanto a Regressão Logística têm testes estatísticos diretos, habilidade para incorporar efeitos não lineares, e uma gama extensiva de diagnósticos. ( ) Uma vantagem da regressão logística é que só se precisa saber se um evento (ocorrência ou não, fracasso ou sucesso) aconteceu e podemos dessa forma utilizar um valor dicotômico como variável dependente. O procedimento prediz a estimativa da probabilidade que o evento vai ou não acontecer. ( ) Em vez de minimizar o quadrado dos desvios, a Regressão Logística minimiza a probabilidade de que o evento ocorra.

Assinale a alternativa que indica a sequência correta, de cima para baixo.
Alternativas
Ano: 2023 Banca: FEPESE Órgão: EPAGRI Prova: FEPESE - 2023 - EPAGRI - Estatístico |
Q2073938 Estatística
Considere a matriz de variância e covariância a seguir, e que os dois maiores autovalores dessa matriz sejam autovalor1 = 5,7 e autovalor2 = 4,3.
Imagem associada para resolução da questão



Considerando a análise de componentes principais, assinale a alternativa que traz a taxa de variação explicada por autovalor1 e autovalor2.
Alternativas
Respostas
1: E
2: E
3: E
4: C
5: C
6: C
7: C
8: E
9: C
10: E
11: C
12: C
13: B
14: D
15: A
16: B
17: C
18: B
19: C
20: D