Questões de Estatística - Componentes principais para Concurso
Foram encontradas 31 questões
Ano: 2012
Banca:
Quadrix
Órgão:
DATAPREV
Prova:
Quadrix - 2012 - DATAPREV - Analista de Tecnologia da Informação - Análise de Informações |
Q443964
Estatística
A análise dos componentes principais é um método de se expressarem os dados multivariados. Ela permite que o pesquisador reoriente os dados para que algumas poucas primeiras dimensões expliquem tantas informações quanto possível. A análise de componentes principais é também útil na identificação e compreensão dos padrões de associação entre as variáveis. Considere as cinco afirmações seguintes, sobre a análise dos componentes principais:
I. O primeiro componente principal, Z1 é dado pela combinação linear das variáveis originais X = [ X1 X2, ..., Xp] com maior variância possível.
II. Todos os componentes principais subsequentes são escolhidos para que não sejam correlacionados a todos os componentes principais anteriores.
III. Em razão de a análise de componentes principais buscar maximizar a variância, ela pode ser altamente sensível às diferenças de escala entre variáveis. Assim, é uma boa ideia padronizar os dados e representá-los por Xs.
IV. A solução para o problema dos componentes principais é obtida realizando-se uma decomposição de autovalor da matriz de correlação. Cada autovetor, indicado por Ui, representa a direção de um desses eixos principais. O vetor u controla os pesos usados para formar a combinação linear de Xs, que resulta em zi= Xs.Ui.
VI. No caso mais geral, só faz sentido utilizar a análise dos componentes principais quando os dados não são independentes. Barlett fornece um teste de qui- quadrado para determinar a esfericidade dos dados, 2 representado por X 2 = - [ n - 1 + (2p + 6)/5]ln | R|, com 2 (p2 - p)/2 graus de liberdade, onde p é o número de variáveis, n é o tamanho da amostra, e R é a matriz de correlação.
Dentre as seis afirmações dadas, quantas são falsas?
I. O primeiro componente principal, Z1 é dado pela combinação linear das variáveis originais X = [ X1 X2, ..., Xp] com maior variância possível.
II. Todos os componentes principais subsequentes são escolhidos para que não sejam correlacionados a todos os componentes principais anteriores.
III. Em razão de a análise de componentes principais buscar maximizar a variância, ela pode ser altamente sensível às diferenças de escala entre variáveis. Assim, é uma boa ideia padronizar os dados e representá-los por Xs.
IV. A solução para o problema dos componentes principais é obtida realizando-se uma decomposição de autovalor da matriz de correlação. Cada autovetor, indicado por Ui, representa a direção de um desses eixos principais. O vetor u controla os pesos usados para formar a combinação linear de Xs, que resulta em zi= Xs.Ui.
VI. No caso mais geral, só faz sentido utilizar a análise dos componentes principais quando os dados não são independentes. Barlett fornece um teste de qui- quadrado para determinar a esfericidade dos dados, 2 representado por X 2 = - [ n - 1 + (2p + 6)/5]ln | R|, com 2 (p2 - p)/2 graus de liberdade, onde p é o número de variáveis, n é o tamanho da amostra, e R é a matriz de correlação.
Dentre as seis afirmações dadas, quantas são falsas?
Ano: 2014
Banca:
FUNCAB
Órgão:
MDA
Prova:
FUNCAB - 2014 - MDA - Complexidade Intelectual - Engenharia Cartográfica ou Agrimensura |
Q424236
Estatística
A figura abaixo indica um diagrama de espalhamento de Moran para um determinado índice, em que o quadrante Q2 indica valores:
Ano: 2014
Banca:
FCC
Órgão:
TRT - 19ª Região (AL)
Prova:
FCC - 2014 - TRT - 19ª Região (AL) - Analista Judiciário - Estatística |
Q411527
Estatística
Considere as seguintes afirmações relativas às técnicas de Análise Multivariada:
I. A análise de regressão múltipla é uma técnica estatística para analisar a relação entre uma única variável independente e várias variáveis dependentes.
II. Uma das medidas de similaridade usadas na Análise de Agrupamentos é a distância de Minkowsky, que tem como caso particular a distância Euclidiana.
III. Na análise discriminante a variável dependente é métrica e a independente é categórica.
IV. Na análise de correlação canônica a ideia básica é resumir a informação de um conjunto de variáveis-resposta em uma combinação linear, sendo que a escolha dos coeficientes dessa combinação é feita tendo como critério a minimização da correlação entre os conjuntos de variáveis respostas.
Está correto o que consta APENAS em
I. A análise de regressão múltipla é uma técnica estatística para analisar a relação entre uma única variável independente e várias variáveis dependentes.
II. Uma das medidas de similaridade usadas na Análise de Agrupamentos é a distância de Minkowsky, que tem como caso particular a distância Euclidiana.
III. Na análise discriminante a variável dependente é métrica e a independente é categórica.
IV. Na análise de correlação canônica a ideia básica é resumir a informação de um conjunto de variáveis-resposta em uma combinação linear, sendo que a escolha dos coeficientes dessa combinação é feita tendo como critério a minimização da correlação entre os conjuntos de variáveis respostas.
Está correto o que consta APENAS em
Ano: 2013
Banca:
CESPE / CEBRASPE
Órgão:
STF
Prova:
CESPE - 2013 - STF - Analista Judiciário - Estatística |
Q398116
Estatística
Julgue o item a seguir, relativo à análise multivariada.
No método de agrupamento por k-médias, a probabilidade de que a configuração inicial seja próxima do resultado final do agrupamento é aproximadamente igual a 1.
No método de agrupamento por k-médias, a probabilidade de que a configuração inicial seja próxima do resultado final do agrupamento é aproximadamente igual a 1.
Ano: 2013
Banca:
CESPE / CEBRASPE
Órgão:
INPI
Prova:
CESPE - 2013 - INPI - Analista de Planejamento - Estatistica |
Q313970
Estatística
Texto associado
Em um banco de dados, foram armazenadas informações relativas a diversas pesquisas realizadas por pesquisadores de institutos renomados. Entre as variáveis constantes desse banco destacam-se: nome, gênero e titulação do pesquisador; valor financiado da pesquisa; instituto ao qual o pesquisador pertence; número de componentes da equipe; e número de artigos publicados pelo pesquisador.
Com base nessas informações, julgue os itens a seguir.
Com base nessas informações, julgue os itens a seguir.
Considere que a técnica de análise de componentes principais tenha sido utilizada para reduzir as variáveis “número de artigos publicados pelo pesquisador”, “valor financiado” e “número de componentes da equipe” a apenas uma componente. Considere, ainda, que a variância explicada por essa única componente tenha sido igual a 85%. Nessa situação, o resultado da análise de conglomerado, com base nessa componente, será praticamente o mesmo resultado da análise em que se utilizaram as três variáveis citadas.