Questões de Concurso Sobre conhecimentos de estatística em estatística

Foram encontradas 1.223 questões

Q3880238 Estatística
Uma matriz de confusão resume o desempenho da classificação realizada por um classificador em relação a alguns dados de teste. Um caso especial da matriz de confusão é frequentemente utilizado com apenas duas classes, uma designada como classe positiva e a outra classe negativa. Nesse contexto, as quatro células da matriz são designadas como verdadeiros positivos (VP), falsos positivos (FP), verdadeiros negativos (VN) e falsos negativos (FN), conforme indicado na tabela a seguir

Q58.png (314×93)

Com relação ao cálculo das medidas de desempenho, analise as afirmativas a seguir.

I. A medida da especificidade (também conhecido por Taxa de verdadeiros negativos) pode ser alcançada através da fórmula: Especificidade = VN / (VN + FP).
II. A medida da sensibilidade (também conhecido por Taxa de verdadeiros positivos ou Recall) pode ser alcançada através da fórmula: Recall = VP / (VP + FN).
III. O valor preditivo positivo (também conhecido como Precisão) pode ser alcançada através da fórmula: Precisão = VN / (VN + FN)
IV. Por fim, O valor preditivo negativo (VPN) pode ser alcançada através da fórmula: VPN = VP / (VP + FP).

Está correto o que se afirma em 
Alternativas
Q3880221 Estatística
Ciência de Dados (CD) utiliza conjuntos de dados para tentar entender e resolver problemas do mundo real. Com relação aos fundamentos essenciais da CD, analise as afirmativas a seguir.

I. Os dados figuram como o elemento central. O objetivo é extrair desses toda informação possível para que se possam tomar decisões e antecipar resultados de maneira precisa.
II. Não é campo de conhecimento alheio às outras ciências. Ao contrário, que se trata de uma combinação de instrumentos fornecidos por diversos campos do saber, com destaque para a Estatística e a Ciência da Computação.
III. CD lida exclusivamente com a análise de dados estruturados, como planilhas e bancos de dados SQL, focando apenas em visualizações básicas e relatórios descritivos.

Está correto o que se afirma em
Alternativas
Q3879304 Estatística

O gráfico de equidade abaixo apresenta, para cada ano do Ensino Fundamental, a distribuição da proficiência ponderada em Língua Portuguesa na última ADR do município, edição 2025.3. Em cada boxplot, o traço dentro da caixa representa a mediana, e os símbolos na legenda indicam o padrão de desempenho: Defasagem, Intermediário e Adequado.


Distribuição da Proficiência em Língua Portuguesa por ano escolar (1º ao 9º EF) e Nível de Aprendizagem


Imagem associada para resolução da questão


Disponível em: https://sites.google.com/educacao.fortaleza.ce.gov.br/painelsme/. Acesso em: 30 dez. 2025.


Descrição do gráfico: O gráfico intitulado “Distribuição da Proficiência em Língua Portuguesa por ano escolar (1º ao 9º EF) e Nível de Aprendizagem” compara a distribuição da proficiência do 1º ao 9º ano do EF usando boxplots (caixas com mediana) e pontos individuais. A classificação dos pontos é por forma: ✕ Defasagem, ○ Intermediário e ▲ Adequado (legenda no topo). Em geral, do 1º ao 4º ano há medianas mais altas e vários ▲ acima de 7– 8 (com destaque para o 4º ano). O 5º ano cai um pouco. Os menores níveis aparecem no 6º e no 8º ano (medianas perto de 4 – 4,5), e, no 8º, há um ✕ próximo de 3. O 7º fica intermediário e o 9º volta a subir com mais pontos ▲ acima de 7.


Considerando apenas a mediana de cada boxplot, em qual ano o município apresenta o maior nível central de proficiência? 

Alternativas
Q3878694 Estatística
O desempenho de modelos de aprendizado de máquina está intrinsecamente relacionado ao equilíbrio entre viés e variância. Modelos com alto viés tendem a simplificar excessivamente o problema, resultando em subajuste (underfitting), enquanto modelos com alta variância podem capturar ruído nos dados de treinamento, levando ao sobreajuste (overfitting). Para mitigar esses problemas, diversas técnicas de regularização podem ser empregadas, ajustando a complexidade do modelo e melhorando sua capacidade de generalização.
Considerando os conceitos de compensação viés-variância, sobreajuste, subajuste e técnicas de regularização, é correto afirmar que:
Alternativas
Q3874749 Estatística
Uma equipe de análise de risco de um tribunal implanta modelos de classificação para identificar processos com alta probabilidade de resultado desfavorável para a administração, trabalhando com bases historicamente desbalanceadas (poucos casos críticos em relação aos não críticos). Na fase de avaliação, discute-se o uso de validação cruzada, métricas baseadas em limiar de decisão e curvas de desempenho.
Com base nas boas práticas de avaliação de modelos de aprendizado de máquina, inclusive em cenários com classes desbalanceadas, analise as afirmativas a seguir, considerando (V) para a(s) afirmativa(s) verdadeira(s) e (F) para a(s) falsa(s).

( ) Na validação cruzada k-fold estratificada, cada partição de treino e teste preserva aproximadamente a mesma proporção de classes do conjunto original, o que contribui para estimativas de desempenho mais estáveis em problemas com desbalanceamento de classes.
( ) Curvas ROC e a métrica AUC-ROC são tipicamente mais informativas do que curvas precision-recall em cenários com classes fortemente desbalanceadas, justamente porque destacam com maior sensibilidade o comportamento do classificador em relação à classe minoritária.
( ) A métrica F1-score corresponde ao dobro do produto entre precisão (precision) e sensibilidade (recall) dividido pela soma de ambos, de modo que valores muito discrepantes entre precisão e recall tendem a produzir um F1-score relativamente baixo.
( ) Ao diminuir o limiar de decisão de um classificador binário (por exemplo, de 0,7 para 0,3), a precisão tende a aumentar, pois mais exemplos positivos são corretamente identificados como tal, ainda que isso geralmente ocorra às custas de uma redução no recall.

A sequência correta é: 
Alternativas
Q3869745 Estatística
O desempenho de modelos de aprendizado de máquina está intrinsecamente relacionado ao equilíbrio entre viés e variância. Modelos com alto viés tendem a simplificar excessivamente o problema, resultando em subajuste (underfitting), enquanto modelos com alta variância podem capturar ruído nos dados de treinamento, levando ao sobreajuste (overfitting). Para mitigar esses problemas, diversas técnicas de regularização podem ser empregadas, ajustando a complexidade do modelo e melhorando sua capacidade de generalização.
Considerando os conceitos de compensação viés-variância, sobreajuste, subajuste e técnicas de regularização, é correto afirmar que: 
Alternativas
Q3865389 Estatística
Ao acompanhar o tempo gasto para concluir uma mesma tarefa em cinco dias consecutivos, foram registrados os seguintes valores, em minutos: 12, 15, 15, 18 e 20. A partir desses registros, o conjunto que representa corretamente, nessa ordem, a média aritmética simples, a moda e a mediana é:
Alternativas
Q3853095 Estatística
Em uma indústria de componentes usinados, a gerente de Qualidade monitora o diâmetro crítico de um lote de eixos por meio do Gráfico de Controle Estatístico de Processo (CEP) apresentado a seguir:


Imagem associada para resolução da questão


Com base no gráfico apresentado, analise os itens a seguir:

I. O processo pode ser considerado estável até a medição 17, pois, neste intervalo, a variabilidade está contida dentro dos limites de controle, indicando que apenas as causas comuns inerentes ao processo estão em atuação.
II. As variações observadas nas medições 18, 19 e 20 são evidências da ocorrência de causas especiais, que não pertencem ao contexto usual do processo, tornando-o instável e exigindo a intervenção do operador ou supervisor para correção imediata.
III. De acordo com os princípios do CEP (Controle por Prevenção), as anomalias detectadas entre as medições 18 e 20 devem ser tratadas por meio de uma inspeção após a conclusão de todo o ciclo produtivo, para comparação com as especificações e subsequente rejeição ou retrabalho.

Está correto o que se afirma em
Alternativas
Q3851938 Estatística
A estatística de acidentes é muito importante para a empresa avaliar os procedimentos de segurança e a posição relativa da empresa em relação às empresas do mesmo ramo. Assim, uma empresa metalúrgica com 1.000 trabalhadores teve um total de 200.000 horas/homem/trabalhadas, com dois acidentes, com 100 dias de afastamento no mês e um dos trabalhadores perdeu a audição total do ouvido direito, com 600 dias debitados.

A taxa de frequência e de gravidade são, respectivamente,
Alternativas
Q3847984 Estatística
O médico do trabalho resolveu observar e medir, durante o exame periódico, o comportamento de alguns parâmetros clínicos, em uma amostra da população de seus trabalhadores. Selecionou apenas os fumantes e, entre eles, para análise, considerou: a idade, o peso, o número de cigarros diários e o valor da pressão arterial (valores máximo e mínimo).

Segundo conceitos estatísticos, essa sequência dos parâmetros citados corresponde, respectivamente, a variáveis 
Alternativas
Q3799570 Estatística
Bernardo é secretário da Saúde de um determinado município e realizou um estudo sobre o tempo de atendimento em três postos de saúde distintos do SUS. Cada posto adotou um método diferente de organização da fila de espera: fila com tempos variáveis, fila única e filas múltiplas. Os tempos de atendimento estão apresentados na tabela abaixo:

Imagem associada para resolução da questão

Com base na análise dos dados, assinale a alternativa INCORRETA:
Alternativas
Q4110367 Estatística
O coeficiente de correlação r de Pearson fornece uma medida de como duas variáveis numéricas estão associadas em uma amostra e é ___________das unidades de medida das variáveis. O coeficiente de correlação r é sempre um número entre – 1 e + 1, e r = 0 indica que ____________ relação linear entre as duas variáveis da amostra. É importante lembrar que a existência de correlação _____________ causalidade.

Assinale a alternativa que completa, correta e respectivamente, as lacunas do texto.
Alternativas
Q4108181 Estatística
Em uma escola, o professor de matemática aplicou uma prova em duas turmas do 8º ano, A e B, para analisar o desempenho dos alunos. As notas obtidas (de 0 a 10) foram as seguintes:
• turma A (10 alunos): 7, 8, 5, 9, 7, 6, 8, 10, 5, 5.
• turma B (10 alunos): 6, 7, 8, 6, 9, 7, 7, 8, 6, 6.
Com base nesses dados, a respeito das notas das turmas A e B, assinale a alternativa correta. 
Alternativas
Q4099975 Estatística
Sobre a média aritmética, analise as sentenças a seguir:

I- É a única medida de tendência central que sempre assume valores inteiros, mesmo quando aplicada a variáveis discretas.
II- É determinada pela divisão da soma de todos os valores de um conjunto de dados pelo número total de observações.
III- Trata-se de uma medida de tendência central insensível a valores extremos, motivo pelo qual não é recomendada para distribuições simétricas.

Assinale CORRETAMENTE: 
Alternativas
Q4080404 Estatística
Um médico do trabalho foi convocado pelo CEO da empresa em que atua para apresentar os dados de acidente de trabalho. Ao calcular a taxa de incidência de acidentes, você identifica que, no período de janeiro a dezembro de 2024, a empresa contou com 500 empregados expostos ao risco de ruído. Durante esse mesmo período, ocorreram 25 novos casos de acidentes de trabalho típicos registrados em CAT. Com base nesses dados, qual é a taxa de incidência de acidentes de trabalho nesse período, por 100 trabalhadores expostos? 
Alternativas
Q3970429 Estatística
A aprendizagem de máquina é uma ciência que busca formas para um programa aprender a realizar tarefas de forma autônoma a partir de uma amostra de treinamento. Durante a fase de treinamento, utilizando um algoritmo, o sistema gerará um modelo matemático a partir da amostra fornecida. Assim, qual a alternativa traz o algoritmo que analisa pontos em um gráfico, com saída esperada binária, ou seja, só existem duas possibilidades de saída?
Alternativas
Q3895193 Estatística
O departamento de recursos humanos de uma empresa de tecnologia analisou o tempo (em minutos) gasto em pausas para o café por um grupo de 9 funcionários durante um dia de trabalho. Os tempos registrados foram os seguintes: 10, 15, 12, 10, 25, 10, 12, 18, 30. A gerência solicitou um relatório detalhado sobre a distribuição desses tempos para avaliar a política de pausas, focando especificamente nas medidas de tendência central que melhor representam o comportamento do grupo.
Acerca da análise estatística deste conjunto de dados, marque V, para as afirmativas verdadeiras, e F, para as falsas:

(__)A média aritmética do tempo de pausa é exatamente 15 minutos, indicando que a distribuição é perfeitamente simétrica.
(__)O conjunto de dados é bimodal, apresentando duas modas distintas, 10 minutos e 12 minutos.
(__)A mediana, que representa o valor central do conjunto ordenado, é 15 minutos.
(__)A moda deste conjunto é 10 minutos, e a mediana é 12 minutos, sendo a média superior à mediana.

Após análise, assinale a alternativa que apresenta a sequência correta dos itens acima, de cima para baixo:
Alternativas
Q3894796 Estatística
Um laboratório desenvolveu um teste para uma doença rara que afeta 0,5% da população (prevalência). O teste possui uma sensibilidade de 98% (probabilidade de dar positivo se a pessoa está doente) e uma especificidade de 95% (probabilidade de dar negativo se a pessoa não está doente). Um indivíduo é selecionado aleatoriamente da população. Diante deste cenário, é crucial entender as probabilidades associadas aos resultados possíveis do teste, como falsos positivos e falsos negativos, que são fundamentais para a correta interpretação diagnóstica.

Acerca desta situação e dos cálculos de probabilidade envolvidos, marque V, para as afirmativas verdadeiras, e F, para as falsas:

(__) A probabilidade de um indivíduo não doente testar positivo (taxa de Falso Positivo) é de 2%.
(__) Se um indivíduo testa positivo, a probabilidade de ele estar realmente doente é superior a 90%, dada a alta sensibilidade do teste.
(__) A probabilidade de um indivíduo doente testar negativo (taxa de Falso Negativo) é de 5%.
(__) A probabilidade de um indivíduo selecionado aleatoriamente estar doente E testar positivo (Verdadeiro Positivo) é de 0,49%.

Após análise, assinale a alternativa que apresenta a sequência correta dos itens acima, de cima para baixo:
Alternativas
Q3894550 Estatística
O departamento de recursos humanos de uma empresa de tecnologia analisou o tempo (em minutos) gasto em pausas para o café por um grupo de 9 funcionários durante um dia de trabalho. Os tempos registrados foram os seguintes: 10, 15, 12, 10, 25, 10, 12, 18, 30. A gerência solicitou um relatório detalhado sobre a distribuição desses tempos para avaliar a política de pausas, focando especificamente nas medidas de tendência central que melhor representam o comportamento do grupo.

Acerca da análise estatística deste conjunto de dados, marque V, para as afirmativas verdadeiras, e F, para as falsas:

(__) A média aritmética do tempo de pausa é exatamente 15 minutos, indicando que a distribuição é perfeitamente simétrica.
(__) O conjunto de dados é bimodal, apresentando duas modas distintas, 10 minutos e 12 minutos.
(__) A mediana, que representa o valor central do conjunto ordenado, é 15 minutos.
(__) A moda deste conjunto é 10 minutos, e a mediana é 12 minutos, sendo a média superior à mediana.

Após análise, assinale a alternativa que apresenta a sequência correta dos itens acima, de cima para baixo:
Alternativas
Q3849227 Estatística
Em um levantamento interno realizado para avaliar o desempenho de uma equipe, registraram-se as quantidades de atendimentos concluídos por sete colaboradores em um turno específico. Os valores obtidos foram: 12, 18, 15, 12, 20, 18, 12. Para fins de análise estatística, o gestor necessita identificar três medidas fundamentais de tendência central: a média aritmética simples, a moda e a mediana desses dados. Considerando os valores apresentados, assinale a alternativa correta. 
Alternativas
Respostas
61: E
62: C
63: B
64: E
65: B
66: E
67: B
68: C
69: D
70: C
71: D
72: A
73: E
74: C
75: B
76: C
77: A
78: B
79: C
80: C