Questões de Concurso Sobre conhecimentos de estatística em estatística

Foram encontradas 1.223 questões

Q3675038 Estatística
Suponha que você participa de um projeto de mineração de dados e está treinando um modelo de árvore de decisão para um problema de classificação com três categorias: Frutas Cítricas, Frutas Doces e Frutas Oleaginosas. Em um determinado nó da árvore, a distribuição das 80 amostras de treinamento é a seguinte:
Frutas Cítricas: 40 amostras
Frutas Doces: 20 amostras
Frutas Oleaginosas: 20 amostras
Com base nessa distribuição, os valores do Índice de Gini e da Entropia, em bits, são dados, respectivamente, por:
Alternativas
Q3675025 Estatística
A matriz de confusão, relacionada ao resultado na base de teste de um modelo de classificação binária, encontrou os seguintes resultados: 60 verdadeiros positivos, 400 verdadeiros negativos, 20 falsos positivos e 60 falsos negativos. Com base nesses valores, o resultado do F1-Score é 
Alternativas
Q3674682 Estatística
Durante o treinamento de um modelo de regressão polinomial, o cientista de dados observa que o erro no conjunto de treino é muito baixo, mas o erro no conjunto de teste é elevado. Analise as afirmativas a seguir e assinale a que caracteriza corretamente esse fenômeno. 
Alternativas
Q3669431 Estatística
Sobre as medidas de tendência central, assinale a alternativa correta:
Alternativas
Ano: 2025 Banca: NUCEPE Órgão: SEDUC-PI Prova: NUCEPE - 2025 - SEDUC-PI - Analista de Dados |
Q3662534 Estatística
Sobre florestas aleatórias, avalie as seguintes afirmações:
I. Florestas aleatórias utilizam um conjunto de árvores de decisão para realizar tarefas de classificação ou regressão.
II. Uma vantagem da floresta aleatória é a alta precisão em comparação com um único modelo de árvore de decisão.
III. Florestas aleatórias não correm risco de super ajuste do modelo.
IV. O método k-means é diretamente relacionado à floresta aleatória.
Assinale a alternativa que apresenta APENAS as afirmações corretas. 
Alternativas
Ano: 2025 Banca: NUCEPE Órgão: SEDUC-PI Prova: NUCEPE - 2025 - SEDUC-PI - Analista de Dados |
Q3662526 Estatística
Considere uma amostra de tamanho 6 do número de faltas de alunos em uma disciplina. O número de faltas dadas aos alunos foram 2,0,16,8,6,4. Com base neste enunciado, responda à questão.
O valor do desvio padrão amostral das faltas dos alunos é dado por:
Alternativas
Q3660208 Estatística
Qual métrica é comumente usada para avaliar o desempenho de um modelo de classificação binária?
Alternativas
Q3660203 Estatística
O que define a Ciência de Dados como campo interdisciplinar?
Alternativas
Q3647812 Estatística
Sobre as medidas de estatística de tendência central, é correto afirmar que
Alternativas
Q3644750 Estatística
Considere o texto IV para responder às questão.


Texto IV


“[...] O ano de 2024 se encerra com um aumento preocupante dos acidentes de origem elétrica. Infelizmente, muitos ainda encaram a eletricidade como algo inofensivo, acreditando que um simples choque não apresenta riscos. No entanto, o desconhecimento dos perigos, aliado à falta de manutenção das instalações elétricas e à contratação de profissionais não qualificados, são fatores recorrentes nesses incidentes. Paralelamente, ocorrem acidentes envolvendo profissionais que trabalham com eletricidade ou próximos a circuitos energizados, o que reforça a necessidade urgente de aprimorar os conceitos de segurança e, principalmente, de seguir normas [...]”


Fonte: MARTINHO, Edson. DE SOUZA, Danilo Ferreira; MARTINHO, Meire Biudes; MORITA, Lia Hanna Martins; MAIONCHI, Daniela de Oliveira (Org.). ANUÁRIO ESTATÍSTICO DE ACIDENTES DE ORIGEM ELÉTRICA2025 – Ano base 2024. Salto-SP: Abracopel, 2025. [adaptado]
No Mapa 01 apresentado a seguir, encontramos o número de mortes decorrentes de choques elétricos que ocorreram em cada região do Brasil no ano de 2024.


Imagem associada para resolução da questão


Fonte: MARTINHO, Edson. DE SOUZA, Danilo Ferreira; MARTINHO, Meire Biudes; MORITA, Lia Hanna Martins; MAIONCHI, Daniela de Oliveira (Org.). ANUÁRIO ESTATÍSTICO DE ACIDENTES DE ORIGEM ELÉTRICA2025 – Ano base 2024. Salto-SP: Abracopel, 2025. [adaptado]

Considerando o contexto do Texto IV e as informações contidas no Mapa 1, assinale a alternativa CORRETA.
Alternativas
Q3621406 Estatística
Um Estatístico do setor público está planejando uma pesquisa sobre as condições socioeconômicas e de saúde dos funcionários de uma secretaria. No questionário, constam as seguintes variáveis: (1) Cargo ocupado (ex: Analista, Técnico, Assessor); (2) Temperatura corporal em graus Celsius; (3) Ano de nascimento; (4) Salário mensal em Reais (R$). Ao analisar a variável "Salário mensal", o estatístico precisa definir sua escala de medição para determinar as operações estatísticas aplicáveis. A correta classificação da variável "Salário mensal" quanto à sua escala de medição é:
Alternativas
Q3621405 Estatística
A correta distinção entre população e amostra é a base para qualquer estudo estatístico, determinando o alcance e a validade das conclusões. Acerca do assunto, registre V, para as afirmativas verdadeiras, e F, para as falsas:

(__)Parâmetro é uma medida numérica que descreve uma característica de uma amostra, sendo utilizado para estimar o valor correspondente na população.
(__)Amostra é o conjunto de todos os elementos que possuem pelo menos uma característica em comum a ser estudada, sobre o qual se deseja fazer inferências.
(__)Censo é uma técnica especial usada para recolher amostras que garante o acaso na escolha, de modo a garantir o caráter de representatividade.
(__)População é um conjunto de elementos com pelo menos uma característica em comum, que deve delimitar inequivocamente quais os elementos pertencem a ela e quais não.

Após análise, assinale a alternativa que apresenta a sequência correta dos itens acima:
Alternativas
Q3621399 Estatística
A Análise Fatorial (AF) e a Análise de Componentes Principais (ACP) são técnicas multivariadas de redução de dimensionalidade, mas que partem de pressupostos e objetivos distintos. Acerca das características e diferenças entre AF e ACP, registre V, para as afirmativas verdadeiras, e F, para as falsas:

(__)Tanto a Análise Fatorial quanto a Análise de Componentes Principais são modelos matemáticos idênticos que buscam explicar a variância total das variáveis observadas, sendo os termos "fator" e "componente principal" sinônimos.
(__)Na Análise de Componentes Principais (ACP), os componentes são combinações lineares das variáveis originais e são assumidos como as causas latentes que geram as correlações entre essas variáveis.
(__)A Análise Fatorial é uma técnica mais indicada quando o objetivo é apenas a redução de dados para uso em análises subsequentes, sem a necessidade de uma interpretação teórica das dimensões subjacentes.
(__)Na Análise de Componentes Principais (ACP), os componentes principais são calculados de forma a serem ortogonais (não correlacionados) entre si, e o primeiro componente principal é a combinação linear das variáveis originais que captura a maior quantidade possível da variância total dos dados.

Após análise, assinale a alternativa que apresenta a sequência correta dos itens acima, de cima para baixo:
Alternativas
Q3593193 Estatística
Em um estudo técnico baseado em um grande conjunto de dados, foram empregadas técnicas de aprendizado de máquina e análise estatística para identificar padrões e outras informações. Entretanto, os resultados foram questionados, pois, embora tenha sido demonstrada existência de correlação, não foi estabelecida relação de causalidade.
Considerando as melhores práticas e os desafios da mineração de dados, analise as afirmativas a seguir.

I. Foram gerados insights a partir de dados válidos e confiáveis.
II. A equipe executora contava com especialistas com experiência em programação Python, R e SQL.
III. A metodologia empregada atendeu a literatura e outros estudos técnicos semelhantes, descrevendo que foi selecionada apenas uma base de informações de dados não estruturados atualizada para realizar o processamento, em virtude de limitações de capacidade computacional, dos custos envolvidos e dos testes que demonstraram a introdução de incerteza ao se realizar uma coleta ampla e profunda de conjuntos de dados.

Está correto o que se afirma em:
Alternativas
Q3531768 Estatística

A matriz a seguir apresenta dois valores desconhecidos, A e B, que podem ser determinados por diferentes métodos de interpolação geoestatística. 

Com base nas informações apresentadas e considerando que a distância entre dois pontos adjacentes é igual a uma unidade, julgue o item subsequente. 

Se o valor de B for calculado pelo método do inverso do quadrado da distância, o resultado será igual a 25. 
Alternativas
Q3531219 Estatística
A tabela de distribuição apresenta o número de mortes ocorridas na localidade ALFA em 2023, por faixa etária.

Q98.png (166×197)

Considerando a distribuição de frequência que trata da incidência de mortes por violência, assinale com V o que for verdadeiro e com F o que for falso.

( ) A idade média é de 9 anos.
( ) A distribuição é assimétrica.
( ) A idade mediana é de 10 anos.
( ) A incidência de casos com crianças com idade inferior a 8 anos foi de 32,50%.
( ) A melhor representação gráfica para essa distribuição de frequência é o gráfico em pizza.

Está correta, de cima para baixo, a seguinte sequência:
Alternativas
Ano: 2025 Banca: FUVEST Órgão: USP Prova: FUVEST - 2025 - USP - Analista de Sistemas |
Q3509642 Estatística
Uma empresa de e-commerce processa 10 milhões de transações diárias e deseja identificar compras anômalas que possam indicar fraude. Para lidar com esse grande volume de dados, a equipe de ciência de dados decide utilizar o Apache Spark para processar os dados de forma distribuída. A equipe analisou um subconjunto de transações (em dólares):
[35, 42, 38, 40, 1500, 37, 39, 41, 36, 2500, 43, 5000, 38, 44, 3700]
Utilizando o Spark SQL, calcularam a média e o desvio padrão amostral das compras. Um valor é considerado anomalia se estiver acima de 2 desvios padrão da média.
Em relação à situação proposta e à análise, assinale a alternativa que apresenta as transações que podem ser classificadas como anômalas.
Alternativas
Ano: 2025 Banca: UFPR Órgão: UFPR Prova: UFPR - 2025 - UFPR - Estatístico |
Q3506195 Estatística
A análise de correlação canônica é uma técnica estatística usada para: 
Alternativas
Ano: 2025 Banca: UFPR Órgão: UFPR Prova: UFPR - 2025 - UFPR - Estatístico |
Q3506193 Estatística

O texto a seguir é referência para a questão.


Em uma aplicação de análise fatorial, baseada na matriz de covariâncias, p = 4 variáveis (y1, y2, y3 e y4) foram reduzidas a m = 2 fatores comuns (F1 e F2). Adicionalmente, considere a solução com m = 2 fatores, e as seguintes matrizes de cargas fatoriais (L) e matriz diagonal de variâncias específicas ψ:



em que Lij representa a carga da variável i no fator j, e ψij é a variância específica de yi, i, j = 1, 2, 3, 4.  

A correlação entre y1 e F1 é igual a: 
Alternativas
Q3496555 Estatística
Um cientista atuarial está desenvolvendo um modelo para classificar apólices de seguro corporativo com base em três critérios conflitantes: risco de sinistro (a ser minimizado), rentabilidade esperada (a ser maximizada) e nível de fidelização do cliente (a ser maximizado). Para aplicar um método de ponderação aditiva compensatória, ele atribui pesos a cada critério e normaliza os dados em uma escala comum. Durante a análise, percebe que uma apólice com alto risco de sinistro obteve pontuação final superior a outra com risco baixo, mas rentabilidade e fidelização apenas medianas.

Com base nessa situação e nos princípios dos métodos de multicritério, é CORRETO afirmar que:
Alternativas
Respostas
101: C
102: E
103: B
104: B
105: A
106: D
107: B
108: B
109: C
110: A
111: D
112: E
113: B
114: E
115: C
116: C
117: B
118: E
119: C
120: A