Foram encontradas 13.775 questões

Resolva questões gratuitamente!

Junte-se a mais de 4 milhões de concurseiros!

Q3874747 Estatística
Um tribunal deseja prever o tempo de tramitação (em dias) de processos de uma determinada classe, desde a distribuição até a sentença em 1ª instância. Um cientista de dados ajustou um modelo de regressão usando variáveis como tipo de ação, vara, quantidade de partes e histórico de movimentações, e avaliou o modelo no conjunto de teste.
Como métrica principal, ele calculou a soma das diferenças absolutas dividida pelo número de observações, ou: 
q_48 ima.png (162×74)

obtendo Erro = 18, que foi interpretado como: “em média, o modelo erra em 18 dias o tempo de tramitação dos processos”. A métrica utilizada pelo cientista de dados é: 
Alternativas
Q3874592 Estatística
O dono de uma lanchonete coletou uma amostra com 7 valores do tempo de entrega do seu delivery (15, 17, 18, 28, 24, 29 e 30 minutos). Considerando estes dados, a diferença entre o valor da mediana e da média é igual a:
Alternativas
Q3872390 Estatística
Na análise estatística de valores de referência laboratoriais, a distribuição que melhor se adequa a parâmetros bioquímicos como colesterol total é:
Alternativas
Q3871948 Estatística
Na técnica de regressão descontínua (RDD), para estudo de inferência causal,
Alternativas
Q3871708 Estatística

Considere o conjunto populacional: 2, 4, 8, 10. Em seguida, assinale a alternativa que contém CORRETAMENTE o valor da variância do conjunto.

Alternativas
Q3871069 Estatística
Um pesquisador realizou um experimento para avaliar o desempenho de suínos com três dietas, por limitação estrutural, ele alajou os animais em 3 galpões distintos, cada dieta em um galpão. Sabendo-se que os galpões diferem naturalmente entre si quanto a ventilação e temperatura, qual é o melhor delineamento experimental para esse estudo e por qual motivo é o mais adequado?
Alternativas
Q3870235 Estatística
Considere os seguintes valores de Circunferência Escrotal (CE) dos Touros: A – 30 cm; B – 35 cm; C – 35 cm; D – 40 cm; E – 40 cm. A mediana de CE destes Touros é de:
Alternativas
Q3869752 Estatística
Uma equipe de ciência de dados está desenvolvendo um modelo de classificação de inadimplência em um conjunto de dados tabular com informações numéricas e categóricas de clientes (renda, idade, histórico de crédito, limite etc.).
O conjunto está fortemente desbalanceado: apenas 3% dos registros pertencem à classe denominada inadimplente. O time deseja aumentar a quantidade de exemplos da classe minoritária sem simplesmente duplicar registros existentes, gerando novas amostras sintéticas entre os pontos reais da classe positiva, para reduzir o risco de overfitting associado ao oversampling ingênuo.
A técnica de balanceamento de classes adequada para esse cenário é:
Alternativas
Q3869750 Estatística
Um cientista de dados treinou três modelos para prever evasão escolar usando dados de 12.000 alunos de 2019-2023: Random Forest, XGBoost e Regressão Logística. Para avaliar os modelos, dividiu o dataset em 70% treino e 30% teste, treinou cada modelo no conjunto de treino e reportou as seguintes acurácias no teste: RF=89%, XGBoost=91%, Logística=82%. Com base nesses resultados, foi recomendado o XGBoost para produção.
A avaliação dessa metodologia de validação é: 
Alternativas
Q3869748 Estatística

Um tribunal deseja prever o tempo de tramitação (em dias) de processos de uma determinada classe, desde a distribuição até a sentença em 1ª instância. Um cientista de dados ajustou um modelo de regressão usando variáveis como tipo de ação, vara, quantidade de partes e histórico de movimentações, e avaliou o modelo no conjunto de teste.


Como métrica principal, ele calculou a soma das diferenças absolutas dividida pelo número de observações, ou: 


                                                                                Imagem associada para resolução da questão


obtendo Erro = 18, que foi interpretado como: “em média, o modelo erra em 18 dias o tempo de tramitação dos processos”. A métrica utilizada pelo cientista de dados é: 

Alternativas
Q3869745 Estatística
O desempenho de modelos de aprendizado de máquina está intrinsecamente relacionado ao equilíbrio entre viés e variância. Modelos com alto viés tendem a simplificar excessivamente o problema, resultando em subajuste (underfitting), enquanto modelos com alta variância podem capturar ruído nos dados de treinamento, levando ao sobreajuste (overfitting). Para mitigar esses problemas, diversas técnicas de regularização podem ser empregadas, ajustando a complexidade do modelo e melhorando sua capacidade de generalização.
Considerando os conceitos de compensação viés-variância, sobreajuste, subajuste e técnicas de regularização, é correto afirmar que: 
Alternativas
Q3868793 Estatística
Um pesquisador montou um experimento com um delineamento em blocos ao acaso, no esquema fatorial 3 x 5, utilizando três níveis de aplicação de ureia, cinco híbridos de milho e quatro repetições (blocos). Ele iniciou a montagem da tabela de Análise de Variância, porém não inseriu os valores de Graus de Liberdade, conforme representado na Tabela a seguir.

Assinale a alternativa INCORRETА.

Tabela 2. Análise de variância do experimento sem a informação dos Graus de Liberdade, utilizando um esquema fatorial 3x 5.

Q43.png (385×213)
Alternativas
Q3868078 Estatística
Foram divulgadas as idades, em anos, de sete participantes de uma pesquisa: 20, 22, 25, 27, 29, 31, 50. Também foram divulgados os valores da média e da mediana, ambos iguais a 27. Posteriormente, descobriu-se que uma das idades foi anotada de forma incorreta. Qual idade está incorreta e qual deveria ser o valor correto? 
Alternativas
Q3867400 Estatística
Em um setor administrativo, foram registrados os seguintes números de atendimentos realizados ao longo de 7 dias consecutivos: 10, 12, 14, 14, 14, 16 e 18. Com base nesses dados, a média aritmética simples, a moda e a mediana, respectivamente, são: 
Alternativas
Q3866130 Estatística
Em uma determinada turma, a média das notas do exame final foi 4,5, enquanto a mediana foi 7,5. Sabendo que a nota mínima para aprovação é 5,0, a média ou a mediana informadas indicam que 
Alternativas
Q3865389 Estatística
Ao acompanhar o tempo gasto para concluir uma mesma tarefa em cinco dias consecutivos, foram registrados os seguintes valores, em minutos: 12, 15, 15, 18 e 20. A partir desses registros, o conjunto que representa corretamente, nessa ordem, a média aritmética simples, a moda e a mediana é:
Alternativas
Q3864715 Estatística
Um grupo de amigos resolveu comemorar o aniversário do Dr. Névio, delegado titular da DP. As despesas feitas por eles estão representadas, em intervalos de classe, na tabela abaixo:

                                                          Imagem associada para resolução da questão
O valor do gasto mediano do grupo, em reais, foi de: 
Alternativas
Q3864474 Estatística
Em uma determinada turma, a média das notas do exame final foi 4,5, enquanto a mediana foi 7,5. Sabendo que a nota mínima para aprovação é 5,0, a média ou a mediana informadas indicam que 
Alternativas
Q3863782 Estatística

Um engenheiro monitora um processo de retífica de eixos com o Controle Estatístico de Processo. Um eixo produzido está dentro dos limites de especificação quando seu diâmetro está entre 49,98 mm e 50,02 mm. Os dados históricos indicam que o diâmetro dos eixos segue uma distribuição normal, com média de 50,00 mm e desvio padrão de 0,01 mm.


A porcentagem aproximada de eixos produzidos em que se espera obter um diâmetro dentro dos limites de especificação é

Alternativas
Q3863323 Estatística
Na interpretação de um Ensaio Clínico Randomizado que avaliou a eficácia de uma nova droga anti-hipertensiva, obteve-se um Risco Relativo (RR) de 0,85 com um Intervalo de Confiança de 95% (IC95%) de 0,75 a 0,98. Assinale a alternativa que contém a interpretação estatística e epidemiológica correta desses resultados.
Alternativas
Respostas
421: A
422: B
423: B
424: E
425: C
426: B
427: B
428: A
429: D
430: A
431: E
432: E
433: A
434: D
435: B
436: B
437: C
438: B
439: B
440: D