Questões de Estatística para Concurso - Página 116

Q3332251

Ano: 2024 Banca: FIOCRUZ Órgão: FIOCRUZ Prova: FIOCRUZ - 2024 - FIOCRUZ - Tecnologista em Saúde Pública - Jornalista Web |

Q3332251 Estatística

Histogramas têm sido um dos recursos usados para visualização de dados. Eles são diferentes de gráficos de barras porque:

A

ilustram como determinada amostra está distribuída.

B

são sempre horizontais.

C

usam linhas em vez de barras.

D

são uma variação do gráfico pizza.

E

fazem associação com coordenadas geográficas.

Incorreta. Gabarito oficial da banca:

Veja esse conteúdo explicado passo a passo em nossos cursos. Buscar curso

Parabéns! Você acertou!

Mandou bem! Revise esse tema nos nossos cursos. Buscar curso

Q3331594

Ano: 2024 Banca: FIOCRUZ Órgão: FIOCRUZ Prova: FIOCRUZ - 2024 - FIOCRUZ - Tecnologista em Saúde Pública - Citometria de fluxo |

Q3331594 Estatística

A análise que pode ser realizada para se calcular a imprecisão de um resultado laboratorial é:

A

Westgard.

B

coeficiente de variação.

C

média aritmética.

D

desvio padrão.

E

média geométrica.

Incorreta. Gabarito oficial da banca:

Salve essa questão em um caderno para revisar depois. Adicionar a um caderno

Parabéns! Você acertou!

Mantenha o ritmo! Salve no caderno para revisar depois. Adicionar a um caderno

Q3331509

Ano: 2024 Banca: FIOCRUZ Órgão: FIOCRUZ Prova: FIOCRUZ - 2024 - FIOCRUZ - Tecnologista em Saúde Pública - TE56 - Cientista de Dados em Saúde |

Q3331509 Estatística

Considere a seguinte implementação de um modelo de regressão linear múltipla utilizando NumPy e scikit-learn, usado para prever o financiamento de projetos com base em características de projetos e pesquisadores. O código abaixo foi executado e algumas métricas de desempenho foram obtidas.

import numpy as np from sklearn.model_selection import train_ test_split from sklearn.linear_model import LinearRegression from sklearn.metrics import mean_squared_error, mean_absolute_error, r2_score

X = np.array([[1, 50], [2, 60], [3, 70], [4, 80], [5, 90], [1, 55], [2, 65], [3, 75], [4, 85], [5, 95]]) y = np.array([100000, 120000, 150000, 200000, 250000, 110000, 130000, 170000, 230000, 290000]) X_train, X_test, y_train, y_test = train_ test_split(X, y, test_size=0.2, random_ state=0)

model = LinearRegression() model.fit(X_train, y_train) y_pred = model.predict(X_test)

r2 = r2_score(y_test, y_pred) mse = mean_squared_error(y_test, y_pred) rmse = np.sqrt(mse) mae = mean_absolute_error(y_test, y_pred)

print(f”R-Quadrado: {r2}, MSE: {mse}, RMSE: {rmse}, MAE: {mae}”)

Após executar o código, foram obtidas as seguintes métricas de desempenho:

R-Quadrado: 0.9020746527777778 , MSE: 156680555.5555556, R M S E : 1 2 5 1 7 . 2 1 0 3 7 4 3 4 2 8 2 3 , M A E : 10083.333333333343

Com base nessas informações, analise as observações abaixo.

I. O valor de R-Quadrado próximo de 1 indica que o modelo explica uma grande proporção da variância dos dados de financiamento. Isso sugere que o modelo tem um bom ajuste aos dados, sendo capaz de capturar uma grande parte da relação entre as variáveis independentes e a variável dependente.

II. Um valor de MSE de aproximadamente 156 milhões sugere que, em média, o quadrado dos erros das previsões do modelo em relação aos valores reais é significativo. Isso indica que o modelo tem um bom ajuste de acordo e não existem erros consideráveis nas previsões.

III. Um MAE de aproximadamente 10083 sugere que, em média, as previsões do modelo desviam cerca de 10083 unidades dos valores reais. Comparado ao RMSE, o MAE não dá um peso tão grande a erros maiores, o que sugere que o modelo pode ter um número relativamente consistente de pequenos a moderados erros de previsão.

IV.A diferença entre o RMSE e o MAE sugere que o modelo pode estar lidando com alguns outliers ou previsões particularmente imprecisas que afetam mais o RMSE, pois o RMSE penaliza mais erros maiores do que erros menores.

Sobre as afirmativas acima, pode-se dizer que:

A

apenas I e II estão corretas.

B

apenas I e III estão corretas.

C

apenas I, II e III estão corretas.

D

apenas I, III e IV estão corretas.

E

todas estão corretas.

Incorreta. Gabarito oficial da banca:

Veja esse conteúdo explicado passo a passo em nossos cursos. Buscar curso

Parabéns! Você acertou!

Mandou bem! Revise esse tema nos nossos cursos. Buscar curso

Q3331324

Ano: 2024 Banca: FIOCRUZ Órgão: FIOCRUZ Prova: FIOCRUZ - 2024 - FIOCRUZ - Tecnologista em Saúde Pública - Ciência de dados em saúde |

Q3331324 Estatística

Uma das dificuldades de se realizar agrupamentos de dados é a definição do número de grupos. É correto afirmar que contém apenas técnicas ou métricas que podem ser úteis para automatizar a decisão do número K de grupos:

A

homogeneidade interna e dendrograma.

B

dendrograma e coeficiente de silhueta.

C

heterogeneidade externa e método de Ward.

D

método de Ward e método do cotovelo.

E

método do cotovelo e coeficiente de silhueta.

Incorreta. Gabarito oficial da banca:

Compare seu desempenho com quem faz o mesmo concurso. Ver concorrência

Parabéns! Você acertou!

Compare seu desempenho com quem faz o mesmo concurso. Ver concorrência

Q3331323

Ano: 2024 Banca: FIOCRUZ Órgão: FIOCRUZ Prova: FIOCRUZ - 2024 - FIOCRUZ - Tecnologista em Saúde Pública - Ciência de dados em saúde |

Q3331323 Estatística

Sobre o algoritmo K-médias, é correto afirmar que:

A

é usualmente o primeiro algoritmo aplicado para agrupamento inicial de conjuntos de dados.

B

é um algoritmo bastante simples de ser implementado mas não escala para conjunto de dados grandes.

C

não existe garantia de convergência do algoritmo Kmédias.

D

consegue, de maneira efetiva, identificar clusters não convexos.

E

é um algoritmo recomendado para detecção de outliers.

Incorreta. Gabarito oficial da banca:

Esse erro também aparece no seu Resumão. Veja o que melhorar

Parabéns! Você acertou!

Esse acerto está no seu Resumão. Ver Resumão da semana

Q3331322

Ano: 2024 Banca: FIOCRUZ Órgão: FIOCRUZ Prova: FIOCRUZ - 2024 - FIOCRUZ - Tecnologista em Saúde Pública - Ciência de dados em saúde |

Q3331322 Estatística

Dentre as seguintes listas, NÃO contêm apenas algoritmos que podem ser usados para realizar uma regressão, é:

A

Rede neural, Lasso, Árvore de Decisão.

B

Random Forest, KNN, SVM.

C

Rede neural, Ridge, K-médias.

D

Lasso, KNN, Random Forest.

E

Ridge, Lasso, Regressão linear.

Incorreta. Gabarito oficial da banca:

Veja como esse erro impacta seu desempenho geral. Ver estatísticas

Parabéns! Você acertou!

Esse acerto melhora seu desempenho! Veja suas estatísticas

Q3331315

Ano: 2024 Banca: FIOCRUZ Órgão: FIOCRUZ Prova: FIOCRUZ - 2024 - FIOCRUZ - Tecnologista em Saúde Pública - Ciência de dados em saúde |

Q3331315 Estatística

São algoritmos de classificação, EXCETO:

A

K-Vizinhos mais próximos.

B

K-Médias.

C

Árvores de decisão.

D

Máquinas de vetores de suporte.

E

Naive Bayes.

Incorreta. Gabarito oficial da banca:

Veja como esse erro impacta seu desempenho geral. Ver estatísticas

Parabéns! Você acertou!

Esse acerto melhora seu desempenho! Veja suas estatísticas

Q3331313

Ano: 2024 Banca: FIOCRUZ Órgão: FIOCRUZ Prova: FIOCRUZ - 2024 - FIOCRUZ - Tecnologista em Saúde Pública - Ciência de dados em saúde |

Q3331313 Estatística

Considere o problema de calcular agrupamentos dos objetos apresentados na figura abaixo:

Imagem associada para resolução da questão

Considerando a distribuição dos objetos no espaço de acordo com seus atributos ilustrada na figura, o algoritmo de agrupamento indicado para diferenciar os dois grupos seria:

A

k-médias.

B

k-medóides.

C

neighbor joining.

D

DBSCAN.

E

biclustering.

Incorreta. Gabarito oficial da banca:

Veja esse conteúdo explicado passo a passo em nossos cursos. Buscar curso

Parabéns! Você acertou!

Mandou bem! Revise esse tema nos nossos cursos. Buscar curso

Q3331303

Ano: 2024 Banca: FIOCRUZ Órgão: FIOCRUZ Prova: FIOCRUZ - 2024 - FIOCRUZ - Tecnologista em Saúde Pública - Ciência de dados em saúde |

Q3331303 Estatística

Em muitas situações precisamos trabalhar com dados muito volumosos. Imagine que se queira saber a média de altura de todas as pessoas vivas no mundo e não houvesse uma maneira factível de medir todas as pessoas (população). Usualmente, extraímos um conjunto de dados menor mas representativo e então analisamos este subconjunto (amostra). Medimos alguns milhares de pessoas e esperamos que essa medida possa ser próxima o bastante da medida que obteríamos se medíssemos todo mundo. Para que essa medida seja confiável, precisamos calcular o intervalo de confiança. Para isto, precisamos selecionar diversas amostras da população. Este tipo de técnica é chamada de:

A

bootstrapping.

B

seleção de atributo.

C

covariância.

D

correlação.

E

estimativa.

Incorreta. Gabarito oficial da banca:

Compare seu desempenho com quem faz o mesmo concurso. Ver concorrência

Parabéns! Você acertou!

Compare seu desempenho com quem faz o mesmo concurso. Ver concorrência

Q3331302

Ano: 2024 Banca: FIOCRUZ Órgão: FIOCRUZ Prova: FIOCRUZ - 2024 - FIOCRUZ - Tecnologista em Saúde Pública - Ciência de dados em saúde |

Q3331302 Estatística

Em relação a coleções de valores aleatórios gerados a partir de distribuições de probabilidade:

I. Se selecionamos um valor, em seguida outro e outro formando uma lista, sua média é o valor esperado.
II. Variáveis independentes são aquelas que não dependem das outras variáveis ou seja não se influenciam.
III. Muitos algoritmos de aprendizado de máquina requerem variáveis independentes e identicamente distribuídas ou seja selecionadas da mesma distribuição.

De cima para baixo, a sequência correta é:

A

V, F e F.

B

F, V e F.

C

V, V e F.

D

F, V e V.

E

V, V e V.

Incorreta. Gabarito oficial da banca:

Esse erro também aparece no seu Resumão. Veja o que melhorar

Parabéns! Você acertou!

Esse acerto está no seu Resumão. Ver Resumão da semana

Q3331299

Ano: 2024 Banca: FIOCRUZ Órgão: FIOCRUZ Prova: FIOCRUZ - 2024 - FIOCRUZ - Tecnologista em Saúde Pública - Ciência de dados em saúde |

Q3331299 Estatística

Em relação ao nosso sistema de percepção visual e cognição, é INCORRETO afirmar que:

A

para realizar análise visual de dados, precisamos mais que apenas exibir os dados usando um gráfico.

B

ferramentas gráficas são instrumentos que potencializam o raciocínio sobre informação quantitativa.

C

a maioria das análises envolvem entender as relações entre mais de duas variáveis ao mesmo tempo.

D

a memória tem um papel essencial na análise de dados e nós seres humanos temos uma vasta memória de trabalho.

E

visualização de dados é sobre como utilizar ferramentas externas a nossa mente para potencializar nossa cognição.

Incorreta. Gabarito oficial da banca:

Veja esse conteúdo explicado passo a passo em nossos cursos. Buscar curso

Parabéns! Você acertou!

Mandou bem! Revise esse tema nos nossos cursos. Buscar curso

Q3331298

Ano: 2024 Banca: FIOCRUZ Órgão: FIOCRUZ Prova: FIOCRUZ - 2024 - FIOCRUZ - Tecnologista em Saúde Pública - Ciência de dados em saúde |

Q3331298 Estatística

Quando analisamos dados visualmente, buscamos encontrar e compreender as partes da informação e como elas se relacionam com outras. Por exemplo, em uma série temporal, visamos analisar como determinadas variáveis se relacionam com a variável tempo. Um análise de parte-todo ilustra como as partes se relacionam entre si e com o todo. Séries temporais e parte-todo são dois exemplos de relacionamentos quantitativos clássicos que podem ser visualizados através de técnicas de visualização.

A coluna I mostra os relacionamentos quantitativos e a coluna II as técnicas de visualização. Estabeleça a correta correspondência entre as colunas I e II.

Coluna I

1. Série temporal. 2. Parte-todo.

Coluna II

( ) gráfico de linhas. ( ) gráfico de pizza. ( ) treemap. ( ) gráfico de radar. ( ) gráfico de marimekko.

A sequência correta, de cima para baixo, é:

A

2, 1, 1, 2, 1.

B

2, 2, 1, 2, 1.

C

1, 1, 2, 1, 2.

D

1, 2, 2, 1, 1.

E

1, 2, 2, 1, 2.

Incorreta. Gabarito oficial da banca:

Treine mais com um simulado focado no seu concurso. Criar simulado

Parabéns! Você acertou!

Está mandando bem! Treine mais em um simulado completo. Criar simulado

Q3331293

Ano: 2024 Banca: FIOCRUZ Órgão: FIOCRUZ Prova: FIOCRUZ - 2024 - FIOCRUZ - Tecnologista em Saúde Pública - Ciência de dados em saúde |

Q3331293 Estatística

Em relação à maldição da dimensionalidade, avalie se são verdadeiras (V) ou falsas (F) as afirmativas a seguir:

I. Refere-se ao fenômeno de que muitos tipos de análises de dados se tornam mais difíceis a medida que a dimensionalidade de dados diminui.
II. Para tarefas de classificação, significa que não há instâncias de dados suficientes para criar um modelo que atribua de forma confiável a classe real das instâncias.
III. Quando a dimensionalidade cresce, os dados se tornam cada vez menos esparsos no espaço.

As afirmativas I, II e III são respectivamente:

A

V, F e F.

B

F, V e F.

C

V, V e F.

D

F, V e V.

E

V, V e V.

Incorreta. Gabarito oficial da banca:

Salve essa questão em um caderno para revisar depois. Adicionar a um caderno

Parabéns! Você acertou!

Mantenha o ritmo! Salve no caderno para revisar depois. Adicionar a um caderno

Q3331291

Ano: 2024 Banca: FIOCRUZ Órgão: FIOCRUZ Prova: FIOCRUZ - 2024 - FIOCRUZ - Tecnologista em Saúde Pública - Ciência de dados em saúde |

Q3331291 Estatística

É correto afirmar que os dois tipos de variáveis são quantitativas:

A

nominal e ordinal.

B

nominal e intervalo.

C

intervalo e razão.

D

intervalo e ordinal.

E

razão e intervalo.

Q3331212

Ano: 2024 Banca: FIOCRUZ Órgão: FIOCRUZ Prova: FIOCRUZ - 2024 - FIOCRUZ - Tecnologista em Saúde Pública - Bioinformática |

Q3331212 Estatística

A escolha entre usar um teste de hipótese paramétrico ou não paramétrico depende das características dos dados e dos objetivos da análise. Por exemplo, se as suposições para um teste paramétrico são atendidas, prefere-se usar esses testes devido ao seu maior poder estatístico. Em relação aos testes de hipóteses, é INCORRETO afirmar que:

A

o teste de Shapiro-Wilk pode ser utilizado para testar a normalidade dos dados.

B

o teste de Mann-Whitney é um exemplo de teste não-paramétrico.

C

o teste t de Student deve assumir a normalidade dos dados.

D

o ANOVA é uma alternativa não-paramétrica para o teste de Kruskal-Wallis.

E

o teste de chi-quadrado se destina a encontrar um valor da dispersão para duas variáveis categóricas nominais e avaliar a associação existente entre variáveis qualitativas.

Incorreta. Gabarito oficial da banca:

Compare seu desempenho com quem faz o mesmo concurso. Ver concorrência

Parabéns! Você acertou!

Compare seu desempenho com quem faz o mesmo concurso. Ver concorrência

Q3331037

Ano: 2024 Banca: FIOCRUZ Órgão: FIOCRUZ Prova: FIOCRUZ - 2024 - FIOCRUZ - Tecnologista em Saúde Pública - ecnologia da informação e comunicação (TIC) com foco em análise e desenvolvimento de sistema |

Q3331037 Estatística

É INCORRETO afirmar que os modelos preditivos:

A

podem ser aplicados em áreas como vendas, detecção de fraudes e diagnóstico médico.

B

identificam padrões no histórico dos dados para prever eventos futuros.

C

são também eficazes quando empregam algoritmos de aprendizado de máquina.

D

podem utilizar Redes Neurais Artificiais (RNA).

E

não conseguem alcançar os seus objetivos através da técnica de regressão linear.

Incorreta. Gabarito oficial da banca:

Compare seu desempenho com quem faz o mesmo concurso. Ver concorrência

Parabéns! Você acertou!

Compare seu desempenho com quem faz o mesmo concurso. Ver concorrência

Q3331020

Ano: 2024 Banca: FIOCRUZ Órgão: FIOCRUZ Prova: FIOCRUZ - 2024 - FIOCRUZ - Tecnologista em Saúde Pública - ecnologia da informação e comunicação (TIC) com foco em análise e desenvolvimento de sistema |

Q3331020 Estatística

No contexto da tarefa de aprendizagem não-supervisionada conhecida como clusterização é correto afirmar que a abordagem:

A

hierárquica requer que especifiquemos antecipadamente o número de clusters K.

B

K-means resulta em uma representação na forma de dendrograma.

C

hierárquica resulta em uma representação na forma de dendrograma.

D

K-means é uma abordagem da clusterização aglomerativa.

E

aglomerativa é uma abordagem da clusterização Kmeans.

Incorreta. Gabarito oficial da banca:

Salve essa questão em um caderno para revisar depois. Adicionar a um caderno

Parabéns! Você acertou!

Mantenha o ritmo! Salve no caderno para revisar depois. Adicionar a um caderno

Q3329935

Ano: 2024 Banca: IDCAP Órgão: Prefeitura de Serra - ES Prova: IDCAP - 2024 - Prefeitura de Serra - ES - Estatístico |

Q3329935 Estatística

Considere uma pesquisa realizada para estimar a média de uma característica em uma grande população. Qual das seguintes afirmações sobre métodos de amostragem e estimadores está correta?

A

Na amostragem sistemática, o tamanho da amostra deve ser determinado antes de selecionar o ponto inicial aleatório na lista da população.

B

Na amostragem estratificada, a população é dividida em estratos e a amostra é retirada proporcionalmente de cada estrato, mas os estratos não devem ser homogêneos.

C

A amostragem aleatória simples com reposição é sempre preferível à amostragem aleatória simples sem reposição, pois evita a seleção de indivíduos duplicados.

D

A amostragem em dois estágios envolve a seleção de conglomerados e, em seguida, a seleção aleatória de unidades dentro de cada conglomerado, podendo aumentar a eficiência se os conglomerados forem homogêneos.

E

O estimador de razão é utilizado para estimar a média de uma variável contínua a partir de uma amostra aleatória simples, sem considerar a relação com uma variável auxiliar.

Incorreta. Gabarito oficial da banca:

Salve essa questão em um caderno para revisar depois. Adicionar a um caderno

Parabéns! Você acertou!

Mantenha o ritmo! Salve no caderno para revisar depois. Adicionar a um caderno

Q3329933

Ano: 2024 Banca: IDCAP Órgão: Prefeitura de Serra - ES Prova: IDCAP - 2024 - Prefeitura de Serra - ES - Estatístico |

Q3329933 Estatística

Em um hospital foi feito um estudo estatístico com os índices de recuperação de centenas de pacientes. Verificou-se que o índice médio de recuperação dos pacientes era 6,0 com um desvio padrão de 2,0. Assinale a alternativa que indica o valor Z da variável aleatória normal padronizada para um índice de recuperação igual a 8,0.

A

3,00.

B

1,00.

C

1,75.

D

2,00.

E

1,25.

Incorreta. Gabarito oficial da banca:

Treine mais com um simulado focado no seu concurso. Criar simulado

Parabéns! Você acertou!

Está mandando bem! Treine mais em um simulado completo. Criar simulado

Q3329931

Ano: 2024 Banca: IDCAP Órgão: Prefeitura de Serra - ES Prova: IDCAP - 2024 - Prefeitura de Serra - ES - Estatístico |

Q3329931 Estatística

José Renato irá participar de um jogo de dados. O dado é honesto e possui 6 faces numeradas de 1 a 6. O jogo funciona assim: 1.José Renato irá escolher um número X. 2.O dado será lançado aleatoriamente n vezes. 3.José Renato vence o jogo se ao final dos n lançamentos tenham sido sorteado o seu número X pelo menos k vezes. Assinale a expressão que indica a probabilidade de José Renato vencer este jogo.

A