Questões de Concurso Sobre estatística para fgv

Foram encontradas 1.519 questões

Resolva questões gratuitamente!

Junte-se a mais de 4 milhões de concurseiros!

Q3869752 Estatística
Uma equipe de ciência de dados está desenvolvendo um modelo de classificação de inadimplência em um conjunto de dados tabular com informações numéricas e categóricas de clientes (renda, idade, histórico de crédito, limite etc.).
O conjunto está fortemente desbalanceado: apenas 3% dos registros pertencem à classe denominada inadimplente. O time deseja aumentar a quantidade de exemplos da classe minoritária sem simplesmente duplicar registros existentes, gerando novas amostras sintéticas entre os pontos reais da classe positiva, para reduzir o risco de overfitting associado ao oversampling ingênuo.
A técnica de balanceamento de classes adequada para esse cenário é:
Alternativas
Q3869750 Estatística
Um cientista de dados treinou três modelos para prever evasão escolar usando dados de 12.000 alunos de 2019-2023: Random Forest, XGBoost e Regressão Logística. Para avaliar os modelos, dividiu o dataset em 70% treino e 30% teste, treinou cada modelo no conjunto de treino e reportou as seguintes acurácias no teste: RF=89%, XGBoost=91%, Logística=82%. Com base nesses resultados, foi recomendado o XGBoost para produção.
A avaliação dessa metodologia de validação é: 
Alternativas
Q3869748 Estatística

Um tribunal deseja prever o tempo de tramitação (em dias) de processos de uma determinada classe, desde a distribuição até a sentença em 1ª instância. Um cientista de dados ajustou um modelo de regressão usando variáveis como tipo de ação, vara, quantidade de partes e histórico de movimentações, e avaliou o modelo no conjunto de teste.


Como métrica principal, ele calculou a soma das diferenças absolutas dividida pelo número de observações, ou: 


                                                                                Imagem associada para resolução da questão


obtendo Erro = 18, que foi interpretado como: “em média, o modelo erra em 18 dias o tempo de tramitação dos processos”. A métrica utilizada pelo cientista de dados é: 

Alternativas
Q3869745 Estatística
O desempenho de modelos de aprendizado de máquina está intrinsecamente relacionado ao equilíbrio entre viés e variância. Modelos com alto viés tendem a simplificar excessivamente o problema, resultando em subajuste (underfitting), enquanto modelos com alta variância podem capturar ruído nos dados de treinamento, levando ao sobreajuste (overfitting). Para mitigar esses problemas, diversas técnicas de regularização podem ser empregadas, ajustando a complexidade do modelo e melhorando sua capacidade de generalização.
Considerando os conceitos de compensação viés-variância, sobreajuste, subajuste e técnicas de regularização, é correto afirmar que: 
Alternativas
Q3853103 Estatística
A MetalMec Indústria de Componentes especializada na produção de eixos e componentes metálicos de precisão, identificou aumento no número de peças rejeitadas em suas máquinas CNC. Um inspetor de qualidade coletou, durante 10 dias, dados sobre a temperatura média das máquinas (°C) e o número de peças rejeitadas por dia, obtendo o seguinte gráfico de dispersão.


Imagem associada para resolução da questão


Com base na situação apresentada, analise as afirmações a seguir, classificando-as como verdadeiras (V) ou falsas (F).

( ) Existe uma correlação positiva forte entre a temperatura da máquina e o número de peças rejeitadas.
( ) É possível aplicar um modelo matemático para prever o número de peças rejeitadas em função da temperatura, criando-se uma equação y= a + bx, sendo y a temperatura e x o número de peças rejeitadas.
( ) A causa do aumento de peças rejeitadas é necessariamente a temperatura, e outros fatores podem ser ignorados. (
( ) Uma análise de regressão linear poderia quantificar o impacto da temperatura sobre o índice de rejeição, permitindo ações preventivas mais precisas.

A sequência correta de preenchimento dos parênteses, de cima para baixo, é 
Alternativas
Q3853095 Estatística
Em uma indústria de componentes usinados, a gerente de Qualidade monitora o diâmetro crítico de um lote de eixos por meio do Gráfico de Controle Estatístico de Processo (CEP) apresentado a seguir:


Imagem associada para resolução da questão


Com base no gráfico apresentado, analise os itens a seguir:

I. O processo pode ser considerado estável até a medição 17, pois, neste intervalo, a variabilidade está contida dentro dos limites de controle, indicando que apenas as causas comuns inerentes ao processo estão em atuação.
II. As variações observadas nas medições 18, 19 e 20 são evidências da ocorrência de causas especiais, que não pertencem ao contexto usual do processo, tornando-o instável e exigindo a intervenção do operador ou supervisor para correção imediata.
III. De acordo com os princípios do CEP (Controle por Prevenção), as anomalias detectadas entre as medições 18 e 20 devem ser tratadas por meio de uma inspeção após a conclusão de todo o ciclo produtivo, para comparação com as especificações e subsequente rejeição ou retrabalho.

Está correto o que se afirma em
Alternativas
Ano: 2026 Banca: FGV Órgão: AMAZUL Prova: FGV - 2026 - AMAZUL - Engenheiro de Produção |
Q3852107 Estatística
Uma indústria de autopeças suspeita que os operadores de uma célula de usinagem passam parte significativa do tempo ociosos, possivelmente devido a falhas de balanceamento da linha. Para quantificar esse percentual, o engenheiro de produção opta por aplicar a técnica de amostragem do trabalho, estimando a proporção de tempo em atividade (p). Em um estudo preliminar, estima-se que os operadores permanecem ativos em cerca de 60% do tempo.
Considerando a necessidade de obter uma estimativa com erro absoluto máximo de 5% e nível de confiança de 95% (Z = 1,96), o número mínimo de observações necessárias é, aproximadamente, 
Alternativas
Q3850464 Estatística
Em uma área de 150 hectares de floresta no estado do Piauí, foi realizado um inventário florestal por amostragem casual simples, utilizando-se 15 unidades amostrais retangulares de 20 m × 50 m. O objetivo foi estimar o volume médio com erro amostral máximo admissível de 10% e nível de confiança de 95%. A média amostral foi igual 15 m³/ha e o desvio padrão amostral igual a 4 m³/ha.
Considerando o valor tabelado de t = 2, é correto afirmar que
Alternativas
Q3850249 Estatística
Um laboratório pretende comparar o valor médio de pH entre três marcas de leite comercializadas na mesma região. Foram coletadas amostras independentes de cada marca, os dados apresentaram distribuição aproximadamente normal e variâncias semelhantes entre os grupos.
Com base nessas informações, é correto afirmar que o teste estatístico mais apropriado para verificar se há diferença significativa entre as médias de pH das três marcas é
Alternativas
Q3849668 Estatística
Uma entidade realizou um teste de proficiência da língua inglesa com seus gerentes. A entidade deseja saber o seguinte:

I. A média das notas dos gerentes.
II. A distribuição da frequência de cada nota dos gerentes.
III. A proficiência do idioma entre os diretores que possuem características semelhantes aos gerentes.

Ao utilizar a estatística descritiva, foi possível obter as seguintes informações: 
Alternativas
Q3847212 Estatística
Os teores de álcool na gasolina de um posto em quatro amostras foram: 29%, 30%, 28%, 29,5% e 28,5%.

Assinale a opção que apresenta, respectivamente, o desvio padrão amostral (s) e o coeficiente de variação (CV). 

Dado: 0,0251/2 ≈ 0,158.
Alternativas
Ano: 2026 Banca: FGV Órgão: PC-PI Prova: FGV - 2026 - PC-PI - Oficial Investigador |
Q3846801 Estatística
Trinta estudantes realizaram uma prova de 10 questões de múltipla escolha, em que cada questão valia 1 ponto. A média aritmética e o desvio-padrão das 30 notas obtidas são iguais a M e D, respectivamente.
Se M = 0 ou 10, então D é 
Alternativas
Q3786841 Estatística
A amostra a seguir são 20 observações da quantidade de salários mínimos recebidos por profissionais.

1, 8, 8, 9, 10, 10, 10, 10, 12 15, 15, 16, 16, 18, 20, 20, 29, 30, 30, 38. 

Deseja-se detectar outliers com base no critério que considera outliers as observações que estão fora do intervalo (Q1 – 1,5D, Q3 + 1,5D), sendo Q1 e Q3 os primeiro e terceiro quartis, e D, a distância interquartil.
Nesse caso, assinale a opção que apresenta a totalidade de observações que são consideradas outliers.
Alternativas
Q3786840 Estatística
Se X é uma variável aleatória e se Y = 2X + 3, então o coeficiente de correlação entre X e Y é igual a
Alternativas
Q3786839 Estatística
Suponha uma variável aleatória populacional descrita por uma função de densidade normal com média μ e variância δ2 e que uma amostra aleatória simples X1, X2, ... , Xn, de tamanho n, será obtida dessa população. 
Se    Imagem associada para resolução da questão     avalie se as afirmativas a seguir estão corretas.

I. X é estimador não tendencioso de μ. II. S2 é estimador tendencioso de δ2 . III. X e S2 são correlacionados.

Está correto o que se afirma em
Alternativas
Q3786838 Estatística
Para estimar a média μ de uma população descrita por uma variável aleatória contínua suposta normalmente distribuída com variância igual a 400, uma amostra aleatória simples de tamanho 100 foi obtida e apresentou uma média amostral igual a 250.
Lembrando que o 97,5% percentil da distribuição normal padrão é igual a 1,96, um intervalo de 95% de confiança para μ será dado aproximadamente por
Alternativas
Q3786837 Estatística
Em uma população muito grande, sabe-se que 20% dos eleitores votaram no candidato A nas últimas eleições.
Se seis eleitores dessa população forem aleatoriamente sorteados, a probabilidade de que 2 tenham votado em A nas últimas eleições é aproximadamente igual a
Alternativas
Q3786836 Estatística
A pequena amostra abaixo apresenta os salários mensais, em milhares de reais, de cinco trabalhadores de um certo grupo de atividades. 

  3,2    2,8   5,2   4,2   4,6

A variância amostral desses salários, calculada pela estimativa de máxima verossimilhança da variância salarial mensal desses trabalhadores é, em milhares de reais, aproximadamente igual a
Alternativas
Q3785588 Estatística
Programa/política avaliada: Faixa Azul – sinalização preferencial para motociclistas em vias da cidade de São Paulo, com o objetivo de reduzir sinistros e mortes.
Os pesquisadores avaliaram o impacto da ação sobre os sinistros de trânsito na cidade utilizando métodos de inferência causal… A análise aplica modelos de Diferença-em-Diferenças específicos de adoção escalonada para estimar os efeitos da intervenção. Em todas as especificações, os impactos estimados foram pequenos e estatisticamente indistintos de zero. Se houve efeito, ele foi pequeno a ponto de não ser detectado.
LOUREIRO, Michele. Estudo não encontra relação direta entre Faixa Azul e redução de sinistros em São Paulo. Centro de Estudos das Cidades – Insper, São Paulo, 29 set. 2025.
À luz do método empregado para a avaliação do programa e dos resultados reportados para sinistros/óbitos de motociclistas, assinale a opção que apresenta a conclusão metodologicamente correta. 
Alternativas
Q3785583 Estatística
Leia o trecho a seguir.

Em uma avaliação de resultados/desempenho, ter uma linha de base (baseline) e medidas pós-intervenção no mesmo grupo não é suficiente para atribuir o efeito à intervenção; é necessário um contrafactual válido (grupo de comparação ou contrafactual modelado),

PORQUE
as comparações antes–depois no mesmo grupo permanecem sujeitas a endogeneidade e vieses (tendências, sazonalidade, regressão à média, choques e seleção), os quais são mitigados por delineamentos com contrafactual (p.ex., experimentos aleatorizados, diferenças-em-diferenças, controle sintético).

Sobre o trecho, assinale a afirmativa correta.
Alternativas
Respostas
61: A
62: D
63: A
64: E
65: B
66: C
67: E
68: B
69: D
70: B
71: E
72: A
73: E
74: D
75: A
76: A
77: C
78: B
79: B
80: E