Questões de Concurso Sobre análise multivariada em estatística

Foram encontradas 217 questões

Q4077041 Estatística
Uma Fundação Pública foi incumbida de analisar dados socioeconômicos de municípios, considerando variáveis como renda per capita, índice de escolaridade e acesso a saneamento básico. O objetivo e identificar grupos de municípios com características semelhantes, sem a existência de categorias previamente definidas, permitindo a segmentação para políticas públicas mais específicas. Considerando os tipos de algoritmos de aprendizado de máquina, assinale a alternativa que apresenta um algoritmo adequado para realizar essa tarefa. 
Alternativas
Q4067464 Estatística
Uma Secretaria Estadual analisa contribuintes do ICMS com variáveis numéricas contínuas padronizadas (faturamento, variação intermensal, frequência de retificações e uso de créditos), sem conhecimento prévio do número de grupos, e deseja obter uma estrutura hierárquica interpretável para priorização de auditorias. A combinação técnica que atende ao cenário descrito é
Alternativas
Q3968388 Estatística
Considere a matriz de confusão abaixo, obtida a partir da avaliação de um classificador binário, em que a classe Positiva é a classe de interesse:

                                                    Imagem associada para resolução da questão

Com base nesses dados, tem-se que 
Alternativas
Q3968379 Estatística
Considere um conjunto de dados multidimensional, desprovido de rótulos, no qual se observam agrupamentos com densidades distintas, geometrias não convexas e a presença relevante de ruído. Diante desse cenário, um analista compara diferentes técnicas de agrupamento, levando em conta seus pressupostos teóricos, os critérios adotados para formação dos grupos e suas limitações intrínsecas. Diante dessas características, a técnica de agrupamento que melhor modela o cenário descrito é 
Alternativas
Q3968376 Estatística
Considere as seguintes afirmativas sobre algoritmos e técnicas utilizadas em aprendizado não supervisionado, especialmente no contexto de clusterização:
I. K-Means, DBSCAN e Gaussian Mixture Models (GMM) são métodos amplamente empregados para tarefas de clusterização, embora se baseiem em pressupostos estatísticos e geométricos distintos.
II. DBSCAN e Mean-Shift são algoritmos que não exigem a definição prévia do número de clusters, pois os identificam implicitamente, a partir da densidade dos dados ou da estimação de modos da distribuição.
III. Critérios de informação como Akaike Information Criterion (AIC) e Bayesian Information Criterion (BIC), bem como heurísticas como o método do Elbow, são utilizados como técnicas auxiliares para apoiar a escolha do número adequado de clusters em determinados algoritmos.
É (são) verdadeira(s) a(s) alternativa(s): 
Alternativas
Q3956766 Estatística
Uma Secretaria da Fazenda Estadual precisa analisar 500 mil declarações fiscais para identificar contribuintes com comportamento tributário similar, sem ter exemplos prévios de classificação. A equipe técnica deve agrupar as empresas considerando apenas as características declaradas (receita, despesas, setor, localização) e descobrir padrões naturais nos dados.

A técnica mais adequada para essa tarefa é:

Alternativas
Q3952838 Estatística
Em um problema de classificação binária, P representa a classe positiva e N representa a classe negativa. A matriz de confusão a seguir apresenta as linhas como classes reais e as colunas como classes preditas, com o número de instâncias (amostras) em cada caso.


Imagem associada para resolução da questão


Os valores de precisão e recall para a classe P, nessa ordem, são  
Alternativas
Q3947199 Estatística
Uma Administração Tributária desenvolveu um modelo de aprendizado supervisionado para prever o risco de inadimplência tributária de contribuintes, com o objetivo de priorizar ações de fiscalização. Observou-se que o modelo apresenta excelente desempenho no conjunto de treinamento, mas desempenho significativamente inferior quando aplicado a novos contribuintes (conjunto de teste). Nesse caso, está ocorrendo
Alternativas
Q3932862 Estatística

No que se refere aos processos de ETL (extract, transform, load) e a técnicas de pré-processamento de dados para classificação e visualização de dados, julgue o próximo item.


A análise PCA (análise de componentes principais) é utilizada para simplificar os dados e reduzir o ruído, pois tende a equilibrar as dimensões que têm valores mais extremos (outliers). 

Alternativas
Q3906944 Estatística
        Em uma secretaria de fazenda, analistas de dados buscam identificar perfis de contribuintes com padrões semelhantes de comportamento tributário, de modo a orientar auditorias fiscais preventivas. Nesse contexto, a escolha do método analítico deve considerar a ausência de rótulos previamente definidos e o grande volume de atributos numéricos e categóricos associados às declarações.
A partir da situação anterior, assinale a opção em que é corretamente descrita a técnica mais adequada para a finalidade pretendida pelos analistas de dados em questão.
Alternativas
Ano: 2026 Banca: FCPC Órgão: UFC Prova: FCPC - 2026 - UFC - Estatístico |
Q3900044 Estatística
Máquina de vetores de suporte (SVM - Support Vector Machine) e redes neurais, em suas abordagens clássicas, são ambos métodos de aprendizagem, mas com filosofias diferentes. Abaixo escolha a alternativa que não é uma similaridade entre os métodos. 
Alternativas
Ano: 2026 Banca: FCPC Órgão: UFC Prova: FCPC - 2026 - UFC - Estatístico |
Q3900037 Estatística
O k-means é um método de agrupamento simples. Apesar de apresentar limitações importantes, de modo geral, um ponto forte deste método é ser:
Alternativas
Q3880230 Estatística
Martinha, uma analista da ALEGO, desenvolveu o programa Python (versão 3) que utiliza as bibliotecas numpy (2.0.2) e scikitlearn (versão 1.6.1) para realizar análise discriminante linear. Analise o programa a seguir.

 Imagem associada para resolução da questão

O resultado impresso é igual a
Alternativas
Q3869752 Estatística
Uma equipe de ciência de dados está desenvolvendo um modelo de classificação de inadimplência em um conjunto de dados tabular com informações numéricas e categóricas de clientes (renda, idade, histórico de crédito, limite etc.).
O conjunto está fortemente desbalanceado: apenas 3% dos registros pertencem à classe denominada inadimplente. O time deseja aumentar a quantidade de exemplos da classe minoritária sem simplesmente duplicar registros existentes, gerando novas amostras sintéticas entre os pontos reais da classe positiva, para reduzir o risco de overfitting associado ao oversampling ingênuo.
A técnica de balanceamento de classes adequada para esse cenário é:
Alternativas
Q3757858 Estatística
Em um estudo sobre a qualidade da água de um rio, foram monitoradas 12 variáveis físico-químicas e abundâncias de 15 espécies de insetos aquáticos em 20 pontos de amostragem ao longo de 12 meses. O pesquisador deseja identificar padrões espaciais e temporais nos dados, bem como as variáveis que mais explicam a variação entre os pontos.
Nesse caso, o procedimento estatístico mais adequado seria 
Alternativas
Q3757143 Estatística
Em análise multivariada de dados experimentais, o PCA é usado para
Alternativas
Ano: 2025 Banca: FUNDATEC Órgão: UFRGS Prova: FUNDATEC - 2025 - UFRGS - Estatístico |
Q3705820 Estatística
No contexto da Análise Fatorial Exploratória (AFE), o software SPSS oferece diversos procedimentos e opções de extração, rotação e verificação da adequação dos dados. Com base nesse contexto, assinale a alternativa correta.
Alternativas
Ano: 2025 Banca: FUNDATEC Órgão: UFRGS Prova: FUNDATEC - 2025 - UFRGS - Estatístico |
Q3705819 Estatística
No campo da análise multivariada, existem diferentes técnicas estatísticas, cada uma com finalidades específicas, como redução de dimensionalidade, identificação de variáveis latentes ou agrupamento de casos semelhantes. Com base nesse contexto, assinale a alternativa abaixo que corresponde à Análise de Agrupamentos (Cluster Analysis).
Alternativas
Ano: 2025 Banca: FUNDATEC Órgão: UFRGS Prova: FUNDATEC - 2025 - UFRGS - Estatístico |
Q3705818 Estatística
Segundo Lorena Vicini (2005): “É uma técnica que possibilita a identificação das medidas responsáveis pelas maiores variações entre os resultados, sem perdas significativas de informações. Além disso, transforma um conjunto original de variáveis em outro conjunto de variáveis ortogonais. Essa transformação, em outro conjunto de variáveis, ocorre com a menor perda de informação possível. Essa redução de variáveis só será possível se as variáveis iniciais não forem independentes e possuírem coeficientes de correlação não-nulos” (Adaptado de VICINI, Lorena. Análise multivariada da teoria à prática. Universidade Federal de Santa Maria, Centro de Ciências Naturais e Exatas, Santa Maria, 2005). De acordo com o trecho, qual é a alternativa que melhor representa essa técnica?
Alternativas
Q3642032 Estatística
Uma equipe do Ministério Alfa conduz um projeto baseado em Big Data para entender o perfil de acesso da população a atividades financiadas com recursos federais. A base integra milhões de registros oriundos de plataformas digitais de ingressos, editais culturais, visitas a museus federais e interações nas redes sociais de equipamentos culturais.
Como a pesquisa ainda não tem uma variável-alvo definida, o objetivo inicial é identificar grupos latentes de usuários com padrões semelhantes de comportamento, considerando variáveis como frequência de participação, região e faixa etária. Após essa etapa, a equipe pretende avaliar os fatores que contribuem para o engajamento cultural em regiões com baixa participação e, por fim, recomendar estratégias de ampliação de acesso.
Considerando os modelos multivariados, a natureza da base de dados e os objetivos e etapas propostos para a pesquisa, a equipe responsável deveria: 
Alternativas
Respostas
1: B
2: E
3: E
4: B
5: C
6: D
7: B
8: D
9: E
10: E
11: A
12: A
13: B
14: A
15: C
16: A
17: A
18: C
19: C
20: C