Questões de Concurso
Sobre estatística para fgv
Foram encontradas 1.519 questões
Resolva questões gratuitamente!
Junte-se a mais de 4 milhões de concurseiros!
O conjunto está fortemente desbalanceado: apenas 3% dos registros pertencem à classe denominada inadimplente. O time deseja aumentar a quantidade de exemplos da classe minoritária sem simplesmente duplicar registros existentes, gerando novas amostras sintéticas entre os pontos reais da classe positiva, para reduzir o risco de overfitting associado ao oversampling ingênuo.
A técnica de balanceamento de classes adequada para esse cenário é:
A avaliação dessa metodologia de validação é:
Um tribunal deseja prever o tempo de tramitação (em dias) de processos de uma determinada classe, desde a distribuição até a sentença em 1ª instância. Um cientista de dados ajustou um modelo de regressão usando variáveis como tipo de ação, vara, quantidade de partes e histórico de movimentações, e avaliou o modelo no conjunto de teste.
Como métrica principal, ele calculou a soma das diferenças absolutas dividida pelo número de observações, ou:

obtendo Erro = 18, que foi interpretado como: “em média, o modelo erra em 18 dias o tempo de tramitação dos processos”. A métrica utilizada pelo cientista de dados é:
Considerando os conceitos de compensação viés-variância, sobreajuste, subajuste e técnicas de regularização, é correto afirmar que:
Com base na situação apresentada, analise as afirmações a seguir, classificando-as como verdadeiras (V) ou falsas (F).
( ) Existe uma correlação positiva forte entre a temperatura da máquina e o número de peças rejeitadas.
( ) É possível aplicar um modelo matemático para prever o número de peças rejeitadas em função da temperatura, criando-se uma equação y= a + bx, sendo y a temperatura e x o número de peças rejeitadas.
( ) A causa do aumento de peças rejeitadas é necessariamente a temperatura, e outros fatores podem ser ignorados. (
( ) Uma análise de regressão linear poderia quantificar o impacto da temperatura sobre o índice de rejeição, permitindo ações preventivas mais precisas.
A sequência correta de preenchimento dos parênteses, de cima para baixo, é
Com base no gráfico apresentado, analise os itens a seguir:
I. O processo pode ser considerado estável até a medição 17, pois, neste intervalo, a variabilidade está contida dentro dos limites de controle, indicando que apenas as causas comuns inerentes ao processo estão em atuação.
II. As variações observadas nas medições 18, 19 e 20 são evidências da ocorrência de causas especiais, que não pertencem ao contexto usual do processo, tornando-o instável e exigindo a intervenção do operador ou supervisor para correção imediata.
III. De acordo com os princípios do CEP (Controle por Prevenção), as anomalias detectadas entre as medições 18 e 20 devem ser tratadas por meio de uma inspeção após a conclusão de todo o ciclo produtivo, para comparação com as especificações e subsequente rejeição ou retrabalho.
Está correto o que se afirma em
Considerando a necessidade de obter uma estimativa com erro absoluto máximo de 5% e nível de confiança de 95% (Z = 1,96), o número mínimo de observações necessárias é, aproximadamente,
Considerando o valor tabelado de t = 2, é correto afirmar que
Com base nessas informações, é correto afirmar que o teste estatístico mais apropriado para verificar se há diferença significativa entre as médias de pH das três marcas é
I. A média das notas dos gerentes.
II. A distribuição da frequência de cada nota dos gerentes.
III. A proficiência do idioma entre os diretores que possuem características semelhantes aos gerentes.
Ao utilizar a estatística descritiva, foi possível obter as seguintes informações:
Assinale a opção que apresenta, respectivamente, o desvio padrão amostral (s) e o coeficiente de variação (CV).
Dado: 0,0251/2 ≈ 0,158.
Se M = 0 ou 10, então D é
1, 8, 8, 9, 10, 10, 10, 10, 12 15, 15, 16, 16, 18, 20, 20, 29, 30, 30, 38.
Deseja-se detectar outliers com base no critério que considera outliers as observações que estão fora do intervalo (Q1 – 1,5D, Q3 + 1,5D), sendo Q1 e Q3 os primeiro e terceiro quartis, e D, a distância interquartil.
Nesse caso, assinale a opção que apresenta a totalidade de observações que são consideradas outliers.
Se
avalie se as afirmativas a seguir
estão corretas. I. X é estimador não tendencioso de μ. II. S2 é estimador tendencioso de δ2 . III. X e S2 são correlacionados.
Está correto o que se afirma em
Lembrando que o 97,5% percentil da distribuição normal padrão é igual a 1,96, um intervalo de 95% de confiança para μ será dado aproximadamente por
Se seis eleitores dessa população forem aleatoriamente sorteados, a probabilidade de que 2 tenham votado em A nas últimas eleições é aproximadamente igual a
3,2 2,8 5,2 4,2 4,6
A variância amostral desses salários, calculada pela estimativa de máxima verossimilhança da variância salarial mensal desses trabalhadores é, em milhares de reais, aproximadamente igual a
Os pesquisadores avaliaram o impacto da ação sobre os sinistros de trânsito na cidade utilizando métodos de inferência causal… A análise aplica modelos de Diferença-em-Diferenças específicos de adoção escalonada para estimar os efeitos da intervenção. Em todas as especificações, os impactos estimados foram pequenos e estatisticamente indistintos de zero. Se houve efeito, ele foi pequeno a ponto de não ser detectado.
LOUREIRO, Michele. Estudo não encontra relação direta entre Faixa Azul e redução de sinistros em São Paulo. Centro de Estudos das Cidades – Insper, São Paulo, 29 set. 2025.
À luz do método empregado para a avaliação do programa e dos resultados reportados para sinistros/óbitos de motociclistas, assinale a opção que apresenta a conclusão metodologicamente correta.
Em uma avaliação de resultados/desempenho, ter uma linha de base (baseline) e medidas pós-intervenção no mesmo grupo não é suficiente para atribuir o efeito à intervenção; é necessário um contrafactual válido (grupo de comparação ou contrafactual modelado),
PORQUE
as comparações antes–depois no mesmo grupo permanecem sujeitas a endogeneidade e vieses (tendências, sazonalidade, regressão à média, choques e seleção), os quais são mitigados por delineamentos com contrafactual (p.ex., experimentos aleatorizados, diferenças-em-diferenças, controle sintético).
Sobre o trecho, assinale a afirmativa correta.