Questões de Estatística - Análise Multivariada para Concurso

Q4198700

Ano: 2026 Banca: CESPE / CEBRASPE Órgão: VALEC Prova: CESPE / CEBRASPE - 2026 - VALEC - Analista - Especialidade: Engenheiro Florestal |

Q4198700 Estatística

No âmbito da análise de produtos entregues por consultorias contratadas pela INFRA S.A. para a caracterização de solos ferroviários, o fiscal deve validar a redução de dimensionalidade de dados multivariados. Acerca de métodos estatísticos e suas análises nesse contexto, julgue o item a seguir.

Caso a consultoria apresente PCA em que os dois primeiros componentes explicam 85% da variância total, o fiscal poderá atestar a conformidade técnica com o critério de Kaiser, mesmo que o autovalor do segundo componente seja inferior a 1,0, uma vez que a variância acumulada é o parâmetro soberano nesse método.

Certo

Errado

Incorreta. Gabarito oficial da banca:

Esse erro também aparece no seu Resumão. Veja o que melhorar

Parabéns! Você acertou!

Esse acerto está no seu Resumão. Ver Resumão da semana

Q4186553

Ano: 2026 Banca: DEPSEC Órgão: UNIFAP Prova: DEPSEC - 2026 - UNIFAP - Estatístico |

Q4186553 Estatística

Em relação às diferenças conceituais e aplicações da Análise de Componentes Principais (PCA) e da Análise Fatorial (AF), julgue os itens a seguir:

I. A PCA busca combinações lineares (componentes principais) que retêm a máxima variância total dos dados observados, sem postular um modelo de erros ou fatores latentes; já a Análise Fatorial assume que as variáveis observadas são funções lineares de fatores latentes comuns acrescidos de erros únicos (especificidades).

II. Na PCA, os componentes são ortogonais e ordenados por variância explicada; na Análise Fatorial, os fatores podem ser rotacionados (ex.: varimax) para facilitar a interpretação, e a comunalidade representa a proporção da variância de cada variável explicada pelos fatores comuns.

III. Uma diferença prática importante é que a PCA é frequentemente usada para redução de dimensionalidade quando o interesse é reter a maior parte da informação, enquanto a Análise Fatorial é mais adequada para identificar estruturas latentes subjacentes (ex.: traços de personalidade, construtos socioeconômicos).

IV. A PCA é invariante a rotações ortogonais dos componentes, ou seja, qualquer rotação dos eixos principais produz a mesma solução; já na Análise Fatorial, a rotação é essencial para tornar os fatores interpretáveis, e diferentes métodos de rotação podem levar a diferentes soluções fatoriais.

V. A PCA pressupõe que os dados seguem uma distribuição normal multivariada e que não há outliers, caso contrário os resultados são sempre inválidos; a Análise Fatorial, por outro lado, é robusta a qualquer tipo de distribuição e não requer normalidade.

Assinale a alternativa com a sequência CORRETA (V/F):

A

V – V – F – F – V

B

V – F – V – V – F

C

F – V – F – V – V

D

V – V – V – F – F

E

F – F – V – V – F

Incorreta. Gabarito oficial da banca:

Salve essa questão em um caderno para revisar depois. Adicionar a um caderno

Parabéns! Você acertou!

Mantenha o ritmo! Salve no caderno para revisar depois. Adicionar a um caderno

Q4186547

Ano: 2026 Banca: DEPSEC Órgão: UNIFAP Prova: DEPSEC - 2026 - UNIFAP - Estatístico |

Q4186547 Estatística

Um pesquisador dispõe de uma matriz de dados com 100 observações e 50 variáveis socioeconômicas. Ele aplica as seguintes técnicas: análise fatorial por máxima verossimilhança (AF), análise discriminante linear (LDA) e clusterização hierárquica. Em relação às propriedades e diferenças entre esses métodos, julgue os itens a seguir:

I. Na análise fatorial (método de máxima verossimilhança), assume-se que as variáveis observadas são combinações lineares de poucos fatores latentes comuns mais termos de erro únicos (especificidades), não correlacionados entre si. A solução dos loadings não é única, podendo ser rotacionada (ex.: varimax) sem alterar a comunalidade total.

II. A análise discriminante linear (LDA) para classificação assume que as covariâncias dentro dos grupos são homogêneas e que os dados seguem distribuição normal multivariada. Quando essas suposições são violadas, a LDA ainda é robusta e geralmente supera a regressão logística em termos de acurácia.

III. A clusterização hierárquica aglomerativa com ligação simples (single linkage) define a distância entre dois clusters como a distância mínima entre qualquer ponto de um cluster e qualquer ponto do outro. Esse método tende a produzir clusters alongados e é sensível a outliers, podendo gerar o efeito de "cadeia".

IV. Diferentemente da LDA, a análise fatorial não utiliza informação sobre grupos predefinidos; ela é uma técnica não supervisionada. No entanto, os escores fatoriais obtidos podem ser usados posteriormente como variáveis de entrada em uma LDA para classificação.

V. A clusterização hierárquica com ligação completa (complete linkage) é monotônica (não produz inversões no dendrograma) e tende a formar clusters compactos. Se os dados contiverem outliers, a ligação completa é mais afetada do que a ligação simples porque um outlier isolado forma um cluster de tamanho 1 a uma distância muito grande dos demais. Assinale a alternativa com a sequência CORRETA (V/F):

A

F – V – V – F – V

B

V – V – F – V – F

C

V – F – V – V – F

D

F – F – V – V – V

E

V – V – V – F – V

Incorreta. Gabarito oficial da banca:

Veja como esse erro impacta seu desempenho geral. Ver estatísticas

Parabéns! Você acertou!

Esse acerto melhora seu desempenho! Veja suas estatísticas

Q4186546

Ano: 2026 Banca: DEPSEC Órgão: UNIFAP Prova: DEPSEC - 2026 - UNIFAP - Estatístico |

Q4186546 Estatística

Uma universidade pública deseja criar um modelo para classificar candidatos ao curso de Estatística em três categorias: "baixo risco de evasão", "médio risco" e "alto risco", com base em variáveis preditoras contínuas (nota no ENEM, coeficiente de rendimento no ensino médio, horas de estudo semanais, renda familiar per capita). O estatístico da instituição opta pela Análise Discriminante Linear (ADL) como técnica de classificação supervisionada.

Assinale a alternativa que apresenta corretamente uma premissa fundamental da ADL e um procedimento de validação apropriado.

A

A ADL exige que as variáveis preditoras sejam categóricas e que as matrizes de covariância dentro dos grupos sejam diferentes.

B

A ADL é robusta à violação da normalidade multivariada quando a amostra é pequena (n < 30 por grupo).

C

As funções discriminantes são obtidas a partir da decomposição da matriz de covariância amostral total em variância intra-grupo e inter-grupo.

D

A validação cruzada “leave-one-out” é desnecessária na ADL, pois a matriz de confusão baseada na própria amostra de treino já fornece estimativas não viesadas do erro de classificação.

E

A Análise Discriminante Quadrática (ADQ) deve ser preferida à ADL quando as matrizes de covariância dos grupos são homogêneas.

Incorreta. Gabarito oficial da banca:

Salve essa questão em um caderno para revisar depois. Adicionar a um caderno

Parabéns! Você acertou!

Mantenha o ritmo! Salve no caderno para revisar depois. Adicionar a um caderno

Q4162701

Ano: 2026 Banca: Marinha Órgão: MARINHA Prova: Marinha - 2026 - MARINHA - Professor EBTT - Oceanografia Física |

Q4162701 Estatística

Uma técnica usual para compreender a variabilidade de dados de séries temporais espaçados irregularmente em um mapa é conhecida como Empirical Orthogonal Function (EOF). Sobre a referida análise, assinale a opção correta.

A

Na oceanografia, análise EOF tem sido amplamente aplicada nos domínios do tempo e da frequência.

B

Uma desvantagem da análise EOF é que ela provê uma descrição compacta da variabilidade espacial da série de dados em termos de funções ortogonais, porém não pode ser aplicada para variabilidade temporal.

C

Embora chamada de empírica, a função não reflete o fato de que ela é definida pela estrutura de covariância de uma série de dados específicos que estão sendo analisados.

D

Os sinais a serem examinados não devem consistir de uma mistura de variáveis.

E

EOF não pode ser considerado um método para particionar a variância de um grupo de séries temporais concorrentes, distribuído espacialmente.

Incorreta. Gabarito oficial da banca:

Errou um tema comum da banca? Veja o que mais costuma cair no Raio-X. Ver raio-X

Parabéns! Você acertou!

Essa questão segue o padrão da banca! Veja o que mais costuma cair. Ver raio-X

Q4119384

Ano: 2026 Banca: FURB Órgão: Prefeitura de Governador Celso Ramos - SC Prova: FURB - 2026 - Prefeitura de Governador Celso Ramos - SC - Analista de Recursos Humanos |

Q4119384 Estatística

Um psicólogo organizacional aplicou um questionário de clima organizacional com 40 itens em uma amostra de 500 servidores. Para verificar a estrutura fatorial do instrumento, ele realizou uma análise fatorial exploratória (AFE) com rotação varimax, obtendo 5 fatores com autovalores > 1, explicando 62% da variância total. No entanto, os itens de um dos fatores tinham cargas cruzadas (cross-loadings ) acima de 0,40 em dois outros fatores. Com base nos critérios de Hair et al. (2014) para validade de construto, a decisão metodológica mais rigorosa é:

A

Ignorar as cargas cruzadas e prosseguir para a análise de confiabilidade alfa de Cronbach.

B

Eliminar os itens com cargas cruzadas e reaplicar a AFE, pois a presença de cross-loadings indica que esses itens não discriminam adequadamente os fatores, comprometendo a validade discriminante.

C

Manter todos os itens como estão, pois a variância explicada é aceitável.

D

Substituir a rotação varimax por rotação oblíqua (promax), pois isso resolve automaticamente as cargas cruzadas.

E

Aumentar o número de fatores para 8, mesmo que os autovalores sejam menores que 1.

Incorreta. Gabarito oficial da banca:

Compare seu desempenho com quem faz o mesmo concurso. Ver concorrência

Parabéns! Você acertou!

Compare seu desempenho com quem faz o mesmo concurso. Ver concorrência

Q4098366

Ano: 2026 Banca: INSTITUTO AOCP Órgão: IF-CE Prova: INSTITUTO AOCP - 2026 - IF-CE - Professor EBTT - Teoria da Computação |

Q4098366 Estatística

Um Professor do IFCE solicita que os alunos analisem dados numéricos coletados por sensores no campus, sem rótulos ou categorias prédefinidas. O objetivo é identificar automaticamente agrupamentos naturais nos dados, revelando padrões de similaridade sem utilizar informações externas. Para isso, o docente orienta que os estudantes escolham, entre os algoritmos estudados, aquele adequado para realizar clusterização em contexto não supervisionado. Diante desse contexto, assinale a alternativa que apresenta corretamente o algoritmo que os alunos devem escolher.

A

SVM (Support Vector Machines).

B

KNN (K-Nearest Neighbors).

C

Gradient Boosting.

D

XGBoost.

E

Mean Shift.

Incorreta. Gabarito oficial da banca:

Veja esse conteúdo explicado passo a passo em nossos cursos. Buscar curso

Parabéns! Você acertou!

Mandou bem! Revise esse tema nos nossos cursos. Buscar curso

Q4089520

Ano: 2026 Banca: INSTITUTO AOCP Órgão: UNIRIO Prova: INSTITUTO AOCP - 2026 - UNIRIO - Estatístico |

Q4089520 Estatística

Na análise de agrupamentos, existem várias medidas que podem ser utilizadas como medidas de distância ou dissemelhança entre os elementos de uma matriz de dados. Além dessas medidas, é possível ter uma visualização do processo de agrupamento hierárquico por meio de gráficos. Nesse sentido, é correto afirmar que o dendograma pode ser feito aplicando

A

as distâncias euclidiana, de Manhattan e de Mahalanobis e os métodos de ligação simples, de ligação completa e de Ward.

B

as distâncias euclidiana, de Manhattan e de Cook e os métodos de ligação simples, de ligação completa e de Ward.

C

as distâncias euclidiana, de Manhattan e de Mahalanobis e os métodos de ligação simples, de ligação completa e de Wilks.

D

as distâncias euclidiana, de Manhattan, e de Kullback-Leibler e os métodos de ligação simples, de ligação completa e de Ward.

E

as distâncias euclidiana, de Manhattan e de Mahalanobis e os métodos de ligação simples, de ligação complexa e de Ward.

Incorreta. Gabarito oficial da banca:

Veja como esse erro impacta seu desempenho geral. Ver estatísticas

Parabéns! Você acertou!

Esse acerto melhora seu desempenho! Veja suas estatísticas

Q4089519

Ano: 2026 Banca: INSTITUTO AOCP Órgão: UNIRIO Prova: INSTITUTO AOCP - 2026 - UNIRIO - Estatístico |

Q4089519 Estatística

A análise de componentes principais é uma técnica de redução de dados em que o objetivo principal é a construção de uma combinação linear das principais variáveis que representa a totalidade. Então, nesse tipo de análise, são aplicados os seguintes gráficos:

A

scree plot, gráfico da PCA e o box plot.

B

scree plot, gráfico da PCA e o biplot.

C

scatter plot, gráfico da PCA e o biplot.

D

scatter plot, gráfico da PCA e o box plot

E

scree plot, gráfico de pontos e o biplot.

Incorreta. Gabarito oficial da banca:

Salve essa questão em um caderno para revisar depois. Adicionar a um caderno

Parabéns! Você acertou!

Mantenha o ritmo! Salve no caderno para revisar depois. Adicionar a um caderno

Q4077041

Ano: 2026 Banca: LEGALLE Concursos Órgão: SEPLAG-MG Prova: LEGALLE Concursos - 2026 - SEPLAG-MG - Pesquisador em Ciências Aplicadas e Políticas Públicas - Métodos Quantitativos Aplicados à Gestão Pública |

Q4077041 Estatística

Uma Fundação Pública foi incumbida de analisar dados socioeconômicos de municípios, considerando variáveis como renda per capita, índice de escolaridade e acesso a saneamento básico. O objetivo e identificar grupos de municípios com características semelhantes, sem a existência de categorias previamente definidas, permitindo a segmentação para políticas públicas mais específicas. Considerando os tipos de algoritmos de aprendizado de máquina, assinale a alternativa que apresenta um algoritmo adequado para realizar essa tarefa.

A

Regressão Logística.

B

DBSCAN (Density-Based Applications wtth Norse).

C

Arvore de Decisão.

D

Naive Bayes.

Incorreta. Gabarito oficial da banca:

Compare seu desempenho com quem faz o mesmo concurso. Ver concorrência

Parabéns! Você acertou!

Compare seu desempenho com quem faz o mesmo concurso. Ver concorrência

Q4067464

Ano: 2026 Banca: FCC Órgão: SEFAZ-GO Prova: FCC - 2026 - SEFAZ-GO - Auditor Fiscal da Receita Estadual - Conhecimentos Específicos |

Q4067464 Estatística

Uma Secretaria Estadual analisa contribuintes do ICMS com variáveis numéricas contínuas padronizadas (faturamento, variação intermensal, frequência de retificações e uso de créditos), sem conhecimento prévio do número de grupos, e deseja obter uma estrutura hierárquica interpretável para priorização de auditorias. A combinação técnica que atende ao cenário descrito é

A

a aplicação de k-means com distância euclidiana, com definição prévia do número de grupos e segmentação plana dos contribuintes.

B

a utilização de clusterização hierárquica divisiva com distância do cosseno para variáveis contínuas padronizadas.

C

a adoção de DBSCAN com métrica de correlação de Pearson para identificar grupos por densidade.

D

o emprego de k-medoids com distância Manhattan para produzir um dendrograma de risco fiscal.

E

a utilização de clusterização hierárquica aglomerativa com método de Ward e distância euclidiana ao quadrado.

Incorreta. Gabarito oficial da banca:

Esse erro também aparece no seu Resumão. Veja o que melhorar

Parabéns! Você acertou!

Esse acerto está no seu Resumão. Ver Resumão da semana

Q3968388

Ano: 2026 Banca: FADESP Órgão: SEFAZ-PA Prova: FADESP - 2026 - SEFAZ-PA - Analista Fazendário |

Q3968388 Estatística

Considere a matriz de confusão abaixo, obtida a partir da avaliação de um classificador binário, em que a classe Positiva é a classe de interesse:

Imagem associada para resolução da questão

Imagem associada para resolução da questão

Com base nesses dados, tem-se que

A

a sensibilidade da classe positiva é de 80% e a especificidade é inferior a 60%.

B

o erro de classificação do modelo é inferior a 25%.

C

o valor da métrica F1-score é superior a 0,75.

D

a precisão da classe positiva é de 80% e o recall é de aproximadamente 66,7%.

E

a acurácia do modelo é de 70% e a precisão da classe positiva é de aproximadamente 66,7%.

Incorreta. Gabarito oficial da banca:

Errou um tema comum da banca? Veja o que mais costuma cair no Raio-X. Ver raio-X

Parabéns! Você acertou!

Essa questão segue o padrão da banca! Veja o que mais costuma cair. Ver raio-X

Q3968379

Ano: 2026 Banca: FADESP Órgão: SEFAZ-PA Prova: FADESP - 2026 - SEFAZ-PA - Analista Fazendário |

Q3968379 Estatística

Considere um conjunto de dados multidimensional, desprovido de rótulos, no qual se observam agrupamentos com densidades distintas, geometrias não convexas e a presença relevante de ruído. Diante desse cenário, um analista compara diferentes técnicas de agrupamento, levando em conta seus pressupostos teóricos, os critérios adotados para formação dos grupos e suas limitações intrínsecas. Diante dessas características, a técnica de agrupamento que melhor modela o cenário descrito é

A

K-Means, pois é capaz de identificar clusters de formatos arbitrários e tratar naturalmente pontos isolados como ruído, desde que o número de grupos seja bem estimado.

B

DBSCAN, uma vez que forma agrupamentos a partir da densidade local dos pontos, não exige a definição prévia do número de clusters e permite identificar observações que não pertencem a nenhum grupo.

C

Gaussian Mixture Models (GMM), o qual atribui cada ponto exclusivamente a um único cluster, com base na menor distância euclidiana ao centroide mais próximo.

D

KNN, já que realiza clusterização ao estimar distribuições probabilísticas dos dados e ajustar múltiplas componentes gaussianas ao conjunto de observações.

E

Mean-Shift, o qual determina os agrupamentos, ao deslocar pontos em direção a centroides previamente definidos, sendo particularmente adequado quando o número de clusters é conhecido a priori.

Incorreta. Gabarito oficial da banca:

Esse erro também aparece no seu Resumão. Veja o que melhorar

Parabéns! Você acertou!

Esse acerto está no seu Resumão. Ver Resumão da semana

Q3968376

Ano: 2026 Banca: FADESP Órgão: SEFAZ-PA Prova: FADESP - 2026 - SEFAZ-PA - Analista Fazendário |

Q3968376 Estatística

Considere as seguintes afirmativas sobre algoritmos e técnicas utilizadas em aprendizado não supervisionado, especialmente no contexto de clusterização:
I. K-Means, DBSCAN e Gaussian Mixture Models (GMM) são métodos amplamente empregados para tarefas de clusterização, embora se baseiem em pressupostos estatísticos e geométricos distintos.
II. DBSCAN e Mean-Shift são algoritmos que não exigem a definição prévia do número de clusters, pois os identificam implicitamente, a partir da densidade dos dados ou da estimação de modos da distribuição.
III. Critérios de informação como Akaike Information Criterion (AIC) e Bayesian Information Criterion (BIC), bem como heurísticas como o método do Elbow, são utilizados como técnicas auxiliares para apoiar a escolha do número adequado de clusters em determinados algoritmos.
É (são) verdadeira(s) a(s) alternativa(s):

A

I, apenas.

B

I e II, apenas.

C

I, II e III.

D

II e III, apenas.

E

III, apenas.

Incorreta. Gabarito oficial da banca:

Veja esse conteúdo explicado passo a passo em nossos cursos. Buscar curso

Parabéns! Você acertou!

Mandou bem! Revise esse tema nos nossos cursos. Buscar curso

Q3956766

Ano: 2026 Banca: FCC Órgão: SEFAZ-SP Prova: FCC - 2026 - SEFAZ-SP - Auditor Fiscal da Receita Estadual - AFRE - Gestão Tributária - Conhecimentos Específicos (P3) |

Q3956766 Estatística

Uma Secretaria da Fazenda Estadual precisa analisar 500 mil declarações fiscais para identificar contribuintes com comportamento tributário similar, sem ter exemplos prévios de classificação. A equipe técnica deve agrupar as empresas considerando apenas as características declaradas (receita, despesas, setor, localização) e descobrir padrões naturais nos dados.

A técnica mais adequada para essa tarefa é:

A

Árvores de decisão, pois criam regras hierárquicas de classificação baseadas em variáveis fiscais usando exemplos rotulados de empresas regulares e irregulares.

B

Análise de séries temporais, pois identifica tendências e padrões sazonais na arrecadação tributária ao longo do tempo para projeções futuras de receita.

C

Regressão logística, pois classifica empresas em categorias de risco fiscal utilizando variáveis preditoras numéricas categóricas com base em histórico de autuações anteriores.

D

K-means clustering, pois agrupa empresas por similaridade sem necessidade de rótulos prévios, identificando padrões naturais nos dados declarados pelos contribuintes.

E

Redes neurais profundas, pois aprendem representações complexas dos dados fiscais através de múltiplas camadas ocultas treinadas com backpropagation supervisionado.

Incorreta. Gabarito oficial da banca:

Esse erro também aparece no seu Resumão. Veja o que melhorar

Parabéns! Você acertou!

Esse acerto está no seu Resumão. Ver Resumão da semana

Q3952838

Ano: 2026 Banca: FADESP Órgão: SEFAZ-PA Prova: FADESP - 2026 - SEFAZ-PA - Auditor Fiscal de Receitas Estaduais - Conhecimentos Gerais |

Q3952838 Estatística

Em um problema de classificação binária, P representa a classe positiva e N representa a classe negativa. A matriz de confusão a seguir apresenta as linhas como classes reais e as colunas como classes preditas, com o número de instâncias (amostras) em cada caso.

Imagem associada para resolução da questão

Os valores de precisão e recall para a classe P, nessa ordem, são

A

0,6 e 0,75.

B

0,75 e 0,6.

C

0,7 e 0,65.

D

0,65 e 0,7.

E

0,75 e 0,65.

Incorreta. Gabarito oficial da banca:

Veja como esse erro impacta seu desempenho geral. Ver estatísticas

Parabéns! Você acertou!

Esse acerto melhora seu desempenho! Veja suas estatísticas

Q3947199

Ano: 2026 Banca: FCC Órgão: SEFAZ-MT Prova: FCC - 2026 - SEFAZ-MT - Fiscal de Tributos Estaduais |

Q3947199 Estatística

Uma Administração Tributária desenvolveu um modelo de aprendizado supervisionado para prever o risco de inadimplência tributária de contribuintes, com o objetivo de priorizar ações de fiscalização. Observou-se que o modelo apresenta excelente desempenho no conjunto de treinamento, mas desempenho significativamente inferior quando aplicado a novos contribuintes (conjunto de teste). Nesse caso, está ocorrendo

A

multicolinearidade, pois as variáveis explicativas são correlacionadas.

B

erro de amostragem, pois a amostra é pequena.

C

underfitting, pois o modelo é excessivamente simples.

D

overfitting, pois o modelo capturou ruído específico da base de treino.

E

heterocedasticidade, pois a variância dos erros não é constante.

Incorreta. Gabarito oficial da banca:

Errou um tema comum da banca? Veja o que mais costuma cair no Raio-X. Ver raio-X

Parabéns! Você acertou!

Essa questão segue o padrão da banca! Veja o que mais costuma cair. Ver raio-X

Q3932862

Ano: 2026 Banca: CESPE / CEBRASPE Órgão: Câmara dos Deputados Prova: CESPE / CEBRASPE - 2026 - Câmara dos Deputados - Técnico Legislativo - Especialidade: Assistente Legislativo e Administrativo - Código: CD-AL- 026 |

Q3932862 Estatística

No que se refere aos processos de ETL (extract, transform, load) e a técnicas de pré-processamento de dados para classificação e visualização de dados, julgue o próximo item.

A análise PCA (análise de componentes principais) é utilizada para simplificar os dados e reduzir o ruído, pois tende a equilibrar as dimensões que têm valores mais extremos (outliers).

Certo

Errado

Incorreta. Gabarito oficial da banca:

Compare seu desempenho com quem faz o mesmo concurso. Ver concorrência

Parabéns! Você acertou!

Compare seu desempenho com quem faz o mesmo concurso. Ver concorrência

Q3906944

Ano: 2026 Banca: CESPE / CEBRASPE Órgão: SEFAZ-PR Prova: CESPE / CEBRASPE - 2026 - SEFAZ-PR - Agente Fazendário Estadual - Função: Profissional de Tecnologia da Informação |

Q3906944 Estatística

Em uma secretaria de fazenda, analistas de dados buscam identificar perfis de contribuintes com padrões semelhantes de comportamento tributário, de modo a orientar auditorias fiscais preventivas. Nesse contexto, a escolha do método analítico deve considerar a ausência de rótulos previamente definidos e o grande volume de atributos numéricos e categóricos associados às declarações.
A partir da situação anterior, assinale a opção em que é corretamente descrita a técnica mais adequada para a finalidade pretendida pelos analistas de dados em questão.

A

A análise de correlação é a técnica mais apropriada para detectar grupos de contribuintes com comportamentos fiscais similares, pois avalia a dependência estatística entre múltiplas variáveis simultaneamente.

B

As árvores de decisão são técnicas não supervisionadas de agrupamento hierárquico, ideais para identificar automaticamente padrões ocultos entre variáveis fiscais heterogêneas.

C

A análise discriminante é adequada para o agrupamento de contribuintes sem rótulos prévios, pois utiliza métricas de distância para maximizar a separação entre grupos formados aleatoriamente.

D

A regressão logística, por ser um método supervisionado, permite agrupar contribuintes com base em características comuns, estimando probabilidades de pertencimento a grupos previamente não definidos.

E

O algoritmo k-means é apropriado para segmentar contribuintes em grupos com padrões semelhantes, desde que as variáveis categóricas sejam previamente transformadas em representações numéricas adequadas.

Incorreta. Gabarito oficial da banca:

Veja esse conteúdo explicado passo a passo em nossos cursos. Buscar curso

Parabéns! Você acertou!

Mandou bem! Revise esse tema nos nossos cursos. Buscar curso

Q3900044

Ano: 2026 Banca: FCPC Órgão: UFC Prova: FCPC - 2026 - UFC - Estatístico |

Q3900044 Estatística

Máquina de vetores de suporte (SVM - Support Vector Machine) e redes neurais, em suas abordagens clássicas, são ambos métodos de aprendizagem, mas com filosofias diferentes. Abaixo escolha a alternativa que não é uma similaridade entre os métodos.

A

Otimização não convexa.

B

Dependem de regularização.

C

Conseguem modelar relações não lineares.

D

São métodos de aprendizagem supervisionado.

Incorreta. Gabarito oficial da banca:

Veja como esse erro impacta seu desempenho geral. Ver estatísticas

Parabéns! Você acertou!

Esse acerto melhora seu desempenho! Veja suas estatísticas

🎯 Saiba o que estudar

🎯 Saiba o que estudar

Questões de Concurso Sobre análise multivariada em estatística

Foram encontradas 226 questões