Foram encontradas 1.518 questões

Resolva questões gratuitamente!

Junte-se a mais de 4 milhões de concurseiros!

Q3883533 Estatística
Uma variável aleatória X tem função de densidade de probabilidade dada por
f(x) = |1 – x|, 0 < x < 2, f(x) = 0, nos demais casos.
O valor esperado de X é igual a
Alternativas
Q3883532 Estatística

Se a função geradora de momentos de uma variável aleatória X é dada por


mX(t) = λ/(λ - t), para t < λ


então a média de X é igual a 

Alternativas
Q3883531 Estatística
Em relação à mediana m de uma variável aleatória X, avalie as afirmativas a seguir.
I. A mediana m de uma variável aleatória X é o quantil 0,5. II. A mediana m de uma variável aleatória X é qualquer número que satisfaz P[X ≤ m] ≤ ½ e P[X ≥ m] ≥ ½.
Imagem associada para resolução da questão 



Está correto o que se afirma em 
Alternativas
Q3883530 Estatística
Se X é uma variável aleatória e g(.) é uma função não negativa com domínio real, então, para todo k > 0,
Alternativas
Q3883529 Estatística
X é uma variável aleatória contínua com função de densidade de probabilidade dada por
f(x) = kx3 , 0 ≤ x ≤ 1, f(x) = 0, nos demais casos,
sendo k uma constante.
O valor esperado de 3X2 + 1 é igual a
Alternativas
Q3883528 Estatística
Dois dados honestos I e II serão lançados e os números obtidos em suas faces superiores serão registrados. Sejam:

X: o número obtido no dado I.
Y: o valor absoluto da diferença entre os dois números obtidos. 
A média de Y vale 
Alternativas
Q3883527 Estatística
Dois dados honestos I e II serão lançados e os números obtidos em suas faces superiores serão registrados. Sejam:

X: o número obtido no dado I.
Y: o valor absoluto da diferença entre os dois números obtidos. 
A média e a variância de X são, respectivamente,
Alternativas
Q3883526 Estatística
A e B são dois eventos tais que P[A] = 0,7 e P[B] = 0,2.
Os valores mínimo e máximo de P[AUB] são, respectivamente,
Alternativas
Q3883524 Estatística
Dois eventos A e B são tais que P[A] = 0,6 e P[B] = 0,5. A probabilidade condicional P[B|A] é igual a 0,4. Assim, a probabilidade condicional P[A|B] é igual a
Alternativas
Q3882019 Estatística
Uma comissão de avaliação de políticas públicas analisa a continuidade de um programa de auxílio emergencial para uma população específica. A legislação vigente determina que o benefício deve ser descontinuado caso haja evidência estatística de que a renda média mensal da população beneficiada superou R$ 800,00, indicando uma recuperação econômica.
Para verificar tal condição, uma auditoria realizou um levantamento com uma amostra aleatória simples de 100 beneficiários, apurando uma renda média amostral de R$ 824,00. Sabe-se, por estudos demográficos prévios, que o desvio padrão populacional da renda é de R$ 120,00.
Considerando um nível de significância de 1% para o teste de hipótese unilateral à direita, e sabendo que o valor crítico da distribuição Normal Padrão para este nível é de aproximadamente 2,33, assinale a alternativa que apresenta a conclusão estatística correta e a recomendação coerente a ser dada pela auditoria à comissão. 
Alternativas
Q3882018 Estatística
Uma consultoria legislativa utiliza um modelo estatístico para prever o impacto fiscal de emendas parlamentares. O modelo assume que a divergência entre o valor previsto e o valor real segue uma Distribuição Normal com média igual a zero.
Sabe-se que a probabilidade de a divergência se situar no intervalo entre a média e um valor positivo k é de aproximadamente 34%.
A probabilidade de a divergência apresentar um valor estritamente superior a 2k é de, aproximadamente,
Alternativas
Q3880241 Estatística
A biblioteca Maptplotlib (versão 3.10) do Python permite que os cientistas de dados elaborem sofisticadas visualizações de análise de dados.

Selecione a visualização gráfica do tipo Boxplot. 
Alternativas
Q3880238 Estatística
Uma matriz de confusão resume o desempenho da classificação realizada por um classificador em relação a alguns dados de teste. Um caso especial da matriz de confusão é frequentemente utilizado com apenas duas classes, uma designada como classe positiva e a outra classe negativa. Nesse contexto, as quatro células da matriz são designadas como verdadeiros positivos (VP), falsos positivos (FP), verdadeiros negativos (VN) e falsos negativos (FN), conforme indicado na tabela a seguir

Q58.png (314×93)

Com relação ao cálculo das medidas de desempenho, analise as afirmativas a seguir.

I. A medida da especificidade (também conhecido por Taxa de verdadeiros negativos) pode ser alcançada através da fórmula: Especificidade = VN / (VN + FP).
II. A medida da sensibilidade (também conhecido por Taxa de verdadeiros positivos ou Recall) pode ser alcançada através da fórmula: Recall = VP / (VP + FN).
III. O valor preditivo positivo (também conhecido como Precisão) pode ser alcançada através da fórmula: Precisão = VN / (VN + FN)
IV. Por fim, O valor preditivo negativo (VPN) pode ser alcançada através da fórmula: VPN = VP / (VP + FP).

Está correto o que se afirma em 
Alternativas
Q3880230 Estatística
Martinha, uma analista da ALEGO, desenvolveu o programa Python (versão 3) que utiliza as bibliotecas numpy (2.0.2) e scikitlearn (versão 1.6.1) para realizar análise discriminante linear. Analise o programa a seguir.

 Imagem associada para resolução da questão

O resultado impresso é igual a
Alternativas
Q3880221 Estatística
Ciência de Dados (CD) utiliza conjuntos de dados para tentar entender e resolver problemas do mundo real. Com relação aos fundamentos essenciais da CD, analise as afirmativas a seguir.

I. Os dados figuram como o elemento central. O objetivo é extrair desses toda informação possível para que se possam tomar decisões e antecipar resultados de maneira precisa.
II. Não é campo de conhecimento alheio às outras ciências. Ao contrário, que se trata de uma combinação de instrumentos fornecidos por diversos campos do saber, com destaque para a Estatística e a Ciência da Computação.
III. CD lida exclusivamente com a análise de dados estruturados, como planilhas e bancos de dados SQL, focando apenas em visualizações básicas e relatórios descritivos.

Está correto o que se afirma em
Alternativas
Q3878697 Estatística
Um tribunal deseja prever o tempo de tramitação (em dias) de processos de uma determinada classe, desde a distribuição até a sentença em 1ª instância. Um cientista de dados ajustou um modelo de regressão usando variáveis como tipo de ação, vara, quantidade de partes e histórico de movimentações, e avaliou o modelo no conjunto de teste. Como métrica principal, ele calculou a soma das diferenças absolutas dividida pelo número de observações, ou: 
Erro = Captura_de Tela 2026-02-11 às 21.27.25.png (142×92) ´
obtendo  Erro = 18, que foi interpretado como: “em média, o modelo erra em 18 dias o tempo de tramitação dos processos”. A métrica utilizada pelo cientista de dados é: 
Alternativas
Q3878694 Estatística
O desempenho de modelos de aprendizado de máquina está intrinsecamente relacionado ao equilíbrio entre viés e variância. Modelos com alto viés tendem a simplificar excessivamente o problema, resultando em subajuste (underfitting), enquanto modelos com alta variância podem capturar ruído nos dados de treinamento, levando ao sobreajuste (overfitting). Para mitigar esses problemas, diversas técnicas de regularização podem ser empregadas, ajustando a complexidade do modelo e melhorando sua capacidade de generalização.
Considerando os conceitos de compensação viés-variância, sobreajuste, subajuste e técnicas de regularização, é correto afirmar que:
Alternativas
Q3874749 Estatística
Uma equipe de análise de risco de um tribunal implanta modelos de classificação para identificar processos com alta probabilidade de resultado desfavorável para a administração, trabalhando com bases historicamente desbalanceadas (poucos casos críticos em relação aos não críticos). Na fase de avaliação, discute-se o uso de validação cruzada, métricas baseadas em limiar de decisão e curvas de desempenho.
Com base nas boas práticas de avaliação de modelos de aprendizado de máquina, inclusive em cenários com classes desbalanceadas, analise as afirmativas a seguir, considerando (V) para a(s) afirmativa(s) verdadeira(s) e (F) para a(s) falsa(s).

( ) Na validação cruzada k-fold estratificada, cada partição de treino e teste preserva aproximadamente a mesma proporção de classes do conjunto original, o que contribui para estimativas de desempenho mais estáveis em problemas com desbalanceamento de classes.
( ) Curvas ROC e a métrica AUC-ROC são tipicamente mais informativas do que curvas precision-recall em cenários com classes fortemente desbalanceadas, justamente porque destacam com maior sensibilidade o comportamento do classificador em relação à classe minoritária.
( ) A métrica F1-score corresponde ao dobro do produto entre precisão (precision) e sensibilidade (recall) dividido pela soma de ambos, de modo que valores muito discrepantes entre precisão e recall tendem a produzir um F1-score relativamente baixo.
( ) Ao diminuir o limiar de decisão de um classificador binário (por exemplo, de 0,7 para 0,3), a precisão tende a aumentar, pois mais exemplos positivos são corretamente identificados como tal, ainda que isso geralmente ocorra às custas de uma redução no recall.

A sequência correta é: 
Alternativas
Q3874747 Estatística
Um tribunal deseja prever o tempo de tramitação (em dias) de processos de uma determinada classe, desde a distribuição até a sentença em 1ª instância. Um cientista de dados ajustou um modelo de regressão usando variáveis como tipo de ação, vara, quantidade de partes e histórico de movimentações, e avaliou o modelo no conjunto de teste.
Como métrica principal, ele calculou a soma das diferenças absolutas dividida pelo número de observações, ou: 
q_48 ima.png (162×74)

obtendo Erro = 18, que foi interpretado como: “em média, o modelo erra em 18 dias o tempo de tramitação dos processos”. A métrica utilizada pelo cientista de dados é: 
Alternativas
Q3869752 Estatística
Uma equipe de ciência de dados está desenvolvendo um modelo de classificação de inadimplência em um conjunto de dados tabular com informações numéricas e categóricas de clientes (renda, idade, histórico de crédito, limite etc.).
O conjunto está fortemente desbalanceado: apenas 3% dos registros pertencem à classe denominada inadimplente. O time deseja aumentar a quantidade de exemplos da classe minoritária sem simplesmente duplicar registros existentes, gerando novas amostras sintéticas entre os pontos reais da classe positiva, para reduzir o risco de overfitting associado ao oversampling ingênuo.
A técnica de balanceamento de classes adequada para esse cenário é:
Alternativas
Respostas
41: A
42: B
43: C
44: B
45: C
46: D
47: B
48: B
49: A
50: B
51: A
52: B
53: E
54: B
55: C
56: A
57: E
58: B
59: A
60: A