Questões de Concurso Sobre estatística

Foram encontradas 14.284 questões

Q3675038 Estatística
Suponha que você participa de um projeto de mineração de dados e está treinando um modelo de árvore de decisão para um problema de classificação com três categorias: Frutas Cítricas, Frutas Doces e Frutas Oleaginosas. Em um determinado nó da árvore, a distribuição das 80 amostras de treinamento é a seguinte:
Frutas Cítricas: 40 amostras
Frutas Doces: 20 amostras
Frutas Oleaginosas: 20 amostras
Com base nessa distribuição, os valores do Índice de Gini e da Entropia, em bits, são dados, respectivamente, por:
Alternativas
Q3675025 Estatística
A matriz de confusão, relacionada ao resultado na base de teste de um modelo de classificação binária, encontrou os seguintes resultados: 60 verdadeiros positivos, 400 verdadeiros negativos, 20 falsos positivos e 60 falsos negativos. Com base nesses valores, o resultado do F1-Score é 
Alternativas
Q3674684 Estatística
Um cientista de dados utiliza validação cruzada k-fold para avaliar o desempenho de um classificador. Sobre a razão de usar essa técnica, é correto afirmar que a validação cruzada 
Alternativas
Q3674682 Estatística
Durante o treinamento de um modelo de regressão polinomial, o cientista de dados observa que o erro no conjunto de treino é muito baixo, mas o erro no conjunto de teste é elevado. Analise as afirmativas a seguir e assinale a que caracteriza corretamente esse fenômeno. 
Alternativas
Q3673439 Estatística
A regressão linear simples e a regressão linear múltipla são modelos econométricos que podem ser utilizados para a previsão de variáveis (dependentes = y) a partir da relação significante com outras variáveis (independentes = x). Para o uso ideal de um modelo desse tipo no sentido de se ter a previsão de algum aspecto financeiro, como receita ou despesas, deve-se tomar como base algumas premissas, como, por exemplo: 
Alternativas
Q3672744 Estatística

Alguns alunos do 8.° Amarelo da Escola Vida Feliz tiveram que fazer uma prova final na disciplina de Matemática para que conseguissem alcançar a média bimestral. A tabela a seguir apresenta as informações sobre as notas que os alunos obtiveram: 

Captura_de tela 2025-10-21 103651.png (476×157)

Fonte: O elaborador, 2024.

De acordo com os dados apresentados na tabela, assinale a alternativa CORRETA.
Alternativas
Q3669431 Estatística
Sobre as medidas de tendência central, assinale a alternativa correta:
Alternativas
Ano: 2025 Banca: NUCEPE Órgão: SEDUC-PI Prova: NUCEPE - 2025 - SEDUC-PI - Analista de Dados |
Q3662536 Estatística

Um pesquisador realizou um ajuste de modelo de regressão linear simples. Abaixo está a saída do código executado no software R:


Imagem associada para resolução da questão


De acordo com a saída do código, qual a alternativa CORRETA?
Alternativas
Ano: 2025 Banca: NUCEPE Órgão: SEDUC-PI Prova: NUCEPE - 2025 - SEDUC-PI - Analista de Dados |
Q3662534 Estatística
Sobre florestas aleatórias, avalie as seguintes afirmações:
I. Florestas aleatórias utilizam um conjunto de árvores de decisão para realizar tarefas de classificação ou regressão.
II. Uma vantagem da floresta aleatória é a alta precisão em comparação com um único modelo de árvore de decisão.
III. Florestas aleatórias não correm risco de super ajuste do modelo.
IV. O método k-means é diretamente relacionado à floresta aleatória.
Assinale a alternativa que apresenta APENAS as afirmações corretas. 
Alternativas
Ano: 2025 Banca: NUCEPE Órgão: SEDUC-PI Prova: NUCEPE - 2025 - SEDUC-PI - Analista de Dados |
Q3662533 Estatística
Um modelo de regressão logística tem a função de ligação dada por:
Imagem associada para resolução da questão
Alternativas
Ano: 2025 Banca: NUCEPE Órgão: SEDUC-PI Prova: NUCEPE - 2025 - SEDUC-PI - Analista de Dados |
Q3662532 Estatística

Um pesquisador educacional coletou dados sobre a relação entre o número de horas de estudo por semana (x) e a nota final em um exame (y). Os dados seguem abaixo: 


Imagem associada para resolução da questão


Ajustando um modelo de regressão linear simples aos dados, os valores estimados do Intercepto (alpha) e coeficiente angular (beta) usando o método de mínimos quadrados são dados, respectivamente, por

Alternativas
Ano: 2025 Banca: NUCEPE Órgão: SEDUC-PI Prova: NUCEPE - 2025 - SEDUC-PI - Analista de Dados |
Q3662531 Estatística

Avaliou-se o tempo de atendimento de dois Call Centers por meio das populações de atendentes do Call Center A e do Call Center B, com o Boxplot dado pelo gráfico abaixo:


Imagem associada para resolução da questão


De acordo com o Boxplot, qual a alternativa CORRETA?

Alternativas
Ano: 2025 Banca: NUCEPE Órgão: SEDUC-PI Prova: NUCEPE - 2025 - SEDUC-PI - Analista de Dados |
Q3662530 Estatística
Uma fábrica está monitorando o tempo de duração de um processo de montagem de peças automotivas. Foi colhida uma amostra de 16 processos, cuja a média de duração em minutos foi de 67,5, com desvio padrão amostral de 15,1. Adotando a distribuição normal, qual é o intervalo de confiança de 95% comImagem associada para resolução da questãopara a média do tempo de duração desses processos?
Alternativas
Ano: 2025 Banca: NUCEPE Órgão: SEDUC-PI Prova: NUCEPE - 2025 - SEDUC-PI - Analista de Dados |
Q3662529 Estatística
Uma editora de livros está analisando a qualidade de suas impressões. A editora encontra uma média de 2 erros de impressão por livro. Suponha que o número de erros de impressão siga uma distribuição Poisson.
Qual é a probabilidade de um livro ter no máximo 3 erros de impressão?
Alternativas
Ano: 2025 Banca: NUCEPE Órgão: SEDUC-PI Prova: NUCEPE - 2025 - SEDUC-PI - Analista de Dados |
Q3662528 Estatística
Uma empresa está analisando a eficácia de seu programa de treinamento para novos funcionários. Historicamente, 1/3 dos novos funcionários completam o treinamento com sucesso. A empresa decide monitorar um grupo de 6 novos funcionários e assume-se uma distribuição binomial para os dados.
Qual a probabilidade de exatamente 3 funcionários completarem o treinamento com sucesso?
Alternativas
Ano: 2025 Banca: NUCEPE Órgão: SEDUC-PI Prova: NUCEPE - 2025 - SEDUC-PI - Analista de Dados |
Q3662527 Estatística
Em uma determinada escola, as notas finais dos alunos em uma disciplina seguem uma distribuição normal com média 7 e desvio padrão 1.
Se a escola deseja premiar os 5% melhores alunos, qual deve ser a nota mínima para receber o prêmio? (adote P(Z<1,645)=0,95)
Alternativas
Ano: 2025 Banca: NUCEPE Órgão: SEDUC-PI Prova: NUCEPE - 2025 - SEDUC-PI - Analista de Dados |
Q3662526 Estatística
Considere uma amostra de tamanho 6 do número de faltas de alunos em uma disciplina. O número de faltas dadas aos alunos foram 2,0,16,8,6,4. Com base neste enunciado, responda à questão.
O valor do desvio padrão amostral das faltas dos alunos é dado por:
Alternativas
Ano: 2025 Banca: NUCEPE Órgão: SEDUC-PI Prova: NUCEPE - 2025 - SEDUC-PI - Analista de Dados |
Q3662525 Estatística
Considere uma amostra de tamanho 6 do número de faltas de alunos em uma disciplina. O número de faltas dadas aos alunos foram 2,0,16,8,6,4. Com base neste enunciado, responda à questão.
A mediana de faltas é dada por
Alternativas
Q3660470 Estatística
O uso de técnicas de análise de regressão são amplamente utilizadas na estatística para prever resultados com base em um conjunto de variáveis de entrada.
Com relação às características da Regressão linear e da Regressão logística, analise os itens a seguir:

I. As duas técnicas buscam modelar a relação entre variáveis dependentes e independentes, no entanto, apresentam como principal diferença o tipo de variável que elas são capazes de prever.
II. A regressão linear minimiza as discrepâncias entre os valores de saída previstos e reais ao ajustar uma probabilidade, onde a variável dependente é limitada entre 0 e 1.
III. Ambos os tipos de regressões requerem um tamanho de amostra adequado e grande, de mesma dimensão, para representar valores em todas as categorias de resposta produzindo modelo com poder estatístico suficiente para detectar efeito significativo.

Está correto o que se afirma em
Alternativas
Q3660447 Estatística
Em relação a regressão logística, analise as afirmativas a seguir.

I. É uma forma especializada de regressão que é formulada para prever e explicar uma variável categórica binária e, não uma medida dependente métrica.
II. Os modelos lineares generalizados podem ser considerados como uma abordagem de modelagem de dois estágios. Primeiro se modela a variável de resposta usando uma distribuição de probabilidade, como a distribuição binomial ou de Poisson e segundo se modela o parâmetro da distribuição usando uma coleção de preditores e uma forma especial de rede neural.
III. A regressão logística por ser usado como uma ferramenta para construir modelos quando existe uma variável de resposta categórica com três níveis. A regressão logística é um tipo de modelo linear não generalizado para variáveis de resposta onde a regressão linear múltipla não funciona muito bem.

Estão corretas as afirmativas
Alternativas
Respostas
981: C
982: E
983: C
984: B
985: C
986: B
987: B
988: C
989: A
990: C
991: B
992: A
993: C
994: D
995: E
996: E
997: D
998: E
999: A
1000: E