Questões de Concurso Sobre análise multivariada em estatística

Foram encontradas 221 questões

Ano: 2025 Banca: FUNDATEC Órgão: UFRGS Prova: FUNDATEC - 2025 - UFRGS - Estatístico |
Q3705820 Estatística
No contexto da Análise Fatorial Exploratória (AFE), o software SPSS oferece diversos procedimentos e opções de extração, rotação e verificação da adequação dos dados. Com base nesse contexto, assinale a alternativa correta.
Alternativas
Ano: 2025 Banca: FUNDATEC Órgão: UFRGS Prova: FUNDATEC - 2025 - UFRGS - Estatístico |
Q3705819 Estatística
No campo da análise multivariada, existem diferentes técnicas estatísticas, cada uma com finalidades específicas, como redução de dimensionalidade, identificação de variáveis latentes ou agrupamento de casos semelhantes. Com base nesse contexto, assinale a alternativa abaixo que corresponde à Análise de Agrupamentos (Cluster Analysis).
Alternativas
Ano: 2025 Banca: FUNDATEC Órgão: UFRGS Prova: FUNDATEC - 2025 - UFRGS - Estatístico |
Q3705818 Estatística
Segundo Lorena Vicini (2005): “É uma técnica que possibilita a identificação das medidas responsáveis pelas maiores variações entre os resultados, sem perdas significativas de informações. Além disso, transforma um conjunto original de variáveis em outro conjunto de variáveis ortogonais. Essa transformação, em outro conjunto de variáveis, ocorre com a menor perda de informação possível. Essa redução de variáveis só será possível se as variáveis iniciais não forem independentes e possuírem coeficientes de correlação não-nulos” (Adaptado de VICINI, Lorena. Análise multivariada da teoria à prática. Universidade Federal de Santa Maria, Centro de Ciências Naturais e Exatas, Santa Maria, 2005). De acordo com o trecho, qual é a alternativa que melhor representa essa técnica?
Alternativas
Q3642032 Estatística
Uma equipe do Ministério Alfa conduz um projeto baseado em Big Data para entender o perfil de acesso da população a atividades financiadas com recursos federais. A base integra milhões de registros oriundos de plataformas digitais de ingressos, editais culturais, visitas a museus federais e interações nas redes sociais de equipamentos culturais.
Como a pesquisa ainda não tem uma variável-alvo definida, o objetivo inicial é identificar grupos latentes de usuários com padrões semelhantes de comportamento, considerando variáveis como frequência de participação, região e faixa etária. Após essa etapa, a equipe pretende avaliar os fatores que contribuem para o engajamento cultural em regiões com baixa participação e, por fim, recomendar estratégias de ampliação de acesso.
Considerando os modelos multivariados, a natureza da base de dados e os objetivos e etapas propostos para a pesquisa, a equipe responsável deveria: 
Alternativas
Q3631443 Estatística
Uma pesquisa com estudantes e funcionários de uma universidade coletou as seguintes variáveis:

•  Categóricas: faixa etária (≤ 30, 31–50, > 50 anos), gênero (masculino/feminino), diagnóstico de hipertensão (sim/não);
•  Numéricas: horas semanais de atividade física, média de pressão arterial.

Considerando a técnica estatística mais adequada para cada objetivo específico da análise, é correto afirmar que se deve usar
Alternativas
Q3621404 Estatística
A Análise de Agrupamento (ou Cluster Analysis) é uma técnica exploratória utilizada para identificar grupos de observações ou variáveis que sejam homogêneos internamente e heterogêneos entre si. Sobre os métodos e conceitos dessa técnica, analise as afirmativas a seguir:

I.Os métodos de agrupamento hierárquico, como o de Ward ou o da ligação completa (complete linkage), não exigem a pré-especificação do número de clusters e o resultado é tipicamente visualizado em um dendrograma, que mostra a sequência de fusões ou divisões dos grupos.
II.O método não hierárquico K-médias (K-means) é ideal para dados que contêm variáveis categóricas e outliers, pois o algoritmo é robusto a esses fatores e utiliza a distância de Manhattan como padrão.
III.No método de agrupamento hierárquico de ligação simples (single linkage), a distância entre dois clusters é definida pela distância entre os dois pontos mais distantes de cada cluster, o que tende a formar grupos esféricos e compactos.

Está correto o que se afirma em:
Alternativas
Q3621403 Estatística
Um pesquisador de marketing deseja prever a probabilidade de um cliente adquirir ou não um novo serviço (variável resposta binária: "compra" vs. "não compra"), com base em um conjunto de variáveis preditoras contínuas e categóricas (idade, renda, histórico de compras, etc.). Além disso, ele quer interpretar como cada variável preditora afeta as chances de compra. Qual técnica estatística multivariada é a mais adequada para este problema de classificação e interpretação?
Alternativas
Q3621399 Estatística
A Análise Fatorial (AF) e a Análise de Componentes Principais (ACP) são técnicas multivariadas de redução de dimensionalidade, mas que partem de pressupostos e objetivos distintos. Acerca das características e diferenças entre AF e ACP, registre V, para as afirmativas verdadeiras, e F, para as falsas:

(__)Tanto a Análise Fatorial quanto a Análise de Componentes Principais são modelos matemáticos idênticos que buscam explicar a variância total das variáveis observadas, sendo os termos "fator" e "componente principal" sinônimos.
(__)Na Análise de Componentes Principais (ACP), os componentes são combinações lineares das variáveis originais e são assumidos como as causas latentes que geram as correlações entre essas variáveis.
(__)A Análise Fatorial é uma técnica mais indicada quando o objetivo é apenas a redução de dados para uso em análises subsequentes, sem a necessidade de uma interpretação teórica das dimensões subjacentes.
(__)Na Análise de Componentes Principais (ACP), os componentes principais são calculados de forma a serem ortogonais (não correlacionados) entre si, e o primeiro componente principal é a combinação linear das variáveis originais que captura a maior quantidade possível da variância total dos dados.

Após análise, assinale a alternativa que apresenta a sequência correta dos itens acima, de cima para baixo:
Alternativas
Q3593054 Estatística
Com relação à detecção de anomalias, avalie as afirmativas a seguir e assinale (V) para verdadeira e (F) para falsa.

( ) A detecção de valor discrepante corresponde à identificação de uma observação, evento ou ponto de dados que representa um espaço vetorial multidimensional convexo e fixo, tornando-o inconsistente em relação ao resto do conjunto de dados.
( ) O aprendizado de máquina e a inteligência artificial são empregados para identificar automaticamente alterações inesperadas no comportamento normal de um conjunto de dados.
( ) As anomalias costumam ser raras e as características do comportamento normal podem ser complexas e dinâmicas, o que torna a detecção desafiadora.

As afirmativas são, respectivamente,
Alternativas
Q3530165 Estatística
A respeito das regras de associação e da análise de agrupamentos na exploração de dados, julgue o item subsequente. 

O algoritmo k-means é um método de clusterização do tipo particional que requer a definição prévia do número de clusters e utiliza a média dos elementos como critério para a atualização dos centroides.
Alternativas
Ano: 2025 Banca: UFPR Órgão: UFPR Prova: UFPR - 2025 - UFPR - Estatístico |
Q3506194 Estatística

O texto a seguir é referência para a questão.


Em uma aplicação de análise fatorial, baseada na matriz de covariâncias, p = 4 variáveis (y1, y2, y3 e y4) foram reduzidas a m = 2 fatores comuns (F1 e F2). Adicionalmente, considere a solução com m = 2 fatores, e as seguintes matrizes de cargas fatoriais (L) e matriz diagonal de variâncias específicas ψ:



em que Lij representa a carga da variável i no fator j, e ψij é a variância específica de yi, i, j = 1, 2, 3, 4.  

O percentual da variação de y1 explicado pelo primeiro fator é igual a: 
Alternativas
Ano: 2025 Banca: UFPR Órgão: UFPR Prova: UFPR - 2025 - UFPR - Estatístico |
Q3506193 Estatística

O texto a seguir é referência para a questão.


Em uma aplicação de análise fatorial, baseada na matriz de covariâncias, p = 4 variáveis (y1, y2, y3 e y4) foram reduzidas a m = 2 fatores comuns (F1 e F2). Adicionalmente, considere a solução com m = 2 fatores, e as seguintes matrizes de cargas fatoriais (L) e matriz diagonal de variâncias específicas ψ:



em que Lij representa a carga da variável i no fator j, e ψij é a variância específica de yi, i, j = 1, 2, 3, 4.  

A correlação entre y1 e F1 é igual a: 
Alternativas
Q3498526 Estatística
Considere o seguinte exemplo: Um pesquisador agrônomo pretende agrupar propriedades rurais com características semelhantes de uso de fertilizantes. A técnica estatística multivariada mais adequada para essa finalidade é: 
Alternativas
Q3496555 Estatística
Um cientista atuarial está desenvolvendo um modelo para classificar apólices de seguro corporativo com base em três critérios conflitantes: risco de sinistro (a ser minimizado), rentabilidade esperada (a ser maximizada) e nível de fidelização do cliente (a ser maximizado). Para aplicar um método de ponderação aditiva compensatória, ele atribui pesos a cada critério e normaliza os dados em uma escala comum. Durante a análise, percebe que uma apólice com alto risco de sinistro obteve pontuação final superior a outra com risco baixo, mas rentabilidade e fidelização apenas medianas.

Com base nessa situação e nos princípios dos métodos de multicritério, é CORRETO afirmar que:
Alternativas
Ano: 2025 Banca: FGV Órgão: SEFAZ-PR Prova: FGV - 2025 - SEFAZ-PR - Auditor Fiscal (Manhã) |
Q3363358 Estatística
Um servidor público de um órgão previdenciário, após analisar um conjunto de dados sobre benefícios concedidos, percebeu uma ampla variação nos valores e nas características dos beneficiários.
Para organizar melhor essas informações, ele precisa agrupar os beneficiários conforme seus perfis, permitindo uma análise mais precisa e a implementação de políticas específicas para cada grupo.
Assinale a opção que contém o algoritmo mais apropriado para realizar a tarefa acima. 
Alternativas
Q3317276 Estatística

Acerca de técnicas utilizadas na ciência de dados, julgue o item a seguir. 


O K-means exige a definição do número de clusters como parâmetro de entrada e tem um desempenho eficiente em grandes conjuntos de dados, mas é sensível a outliers e só funciona bem para clusters esféricos e de densidade semelhante. 

Alternativas
Q3317274 Estatística

Acerca de técnicas utilizadas na ciência de dados, julgue o item a seguir. 


A PCA (análise de componentes principais) é uma técnica que transforma variáveis correlacionadas em componentes principais ortogonais, o que permite a redução da dimensionalidade dos dados; a seleção dos componentes principais é realizada com base na variância explicada por cada componente. 

Alternativas
Q3315463 Estatística

Com relação a imagens térmicas, tratamento e análise de sinais, processamento de imagens e espectroscopia de emissão por plasma induzido por laser (LIBS), julgue o próximo item. 


Métodos como a análise de componentes principais (PCA) ou a análise de componentes independentes (ICA) são usados para reduzir a dimensionalidade de grandes conjuntos de dados espectrais, facilitar a visualização e identificar padrões ocultos para a caracterização de substâncias.

Alternativas
Q3313630 Estatística
Julgue o item que se segue, acerca de microcavidades ópticas, interação luz-matéria e modelos estatísticos.  

Modelos multivariados são essenciais para a análise de dados fotométricos em grandes amostras, o que permite a separação de variáveis correlacionadas.  
Alternativas
Q3307174 Estatística

Julgue o item a seguir, em relação a técnicas de agrupamento, a técnicas de redução de dimensionalidade, e a processamento de linguagem natural.


A análise de componentes principais (PCA) é uma técnica usada para enfatizar a variação e trazer os padrões fortes em um conjunto de dados, e pode ser utilizada para facilitar a exploração e visualização dos dados, pois permite a redução do número de dimensões de um sistema. 

Alternativas
Respostas
21: A
22: C
23: C
24: C
25: C
26: C
27: C
28: B
29: C
30: C
31: B
32: C
33: D
34: A
35: D
36: C
37: C
38: C
39: C
40: C