Foram encontradas 13.775 questões
Resolva questões gratuitamente!
Junte-se a mais de 4 milhões de concurseiros!
De acordo com o Censo 2022, realizado pelo IBGE, observe a Pirâmide Etária abaixo:

Diante do exposto, é INCORRETO afirmar que:
Os dados registrados foram:
Com base no quadro, assinalar a alternativa CORRETA.
Com o objetivo de comparar os dados de hematócrito entre os pacientes portadores de cada uma das doenças, ele pretende utilizar o teste t com as comparações sendo repetidas dois a dois, da seguinte maneira: doença 1 vs. doença 2; doença 1 vs. doença 3; doença 1 vs. doença 4; doença 2 vs. doença 3; doença 2 vs. doença 4; doença 3 vs. doença 4.
Sobre essa proposta de comparação estatística dos dados, foi sugerido a Joaquim utilizar a análise de variância (ANOVA) ao invés do teste t.
De acordo com essa sugestão, a ANOVA é o teste mais recomendado porque, ao realizar múltiplos testes t, ocorre o aumento da
Com base na Tabela, considerando as medidas de tendência central e variabilidade, assinale a afirmativa correta.
I. A média é a medida de tendência central que é calculada somando todos os valores de um conjunto de dados e dividindo o total pelo número de valores.
II. A mediana é sempre igual à média em qualquer distribuição de dados.
III. O desvio-padrão é uma medida de dispersão que mostra quão dispersos estão os dados em relação à média.
IV. A amplitude é calculada como a diferença entre o maior e o menor valor de um conjunto de dados.
Assinale a alternativa correta:
Assinale a opção que indica o método estatístico mais apropriado para essa análise.
Complete a tabela a seguir e julgue as afirmativas a seguir, identificando-as com V ou F, conforme sejam verdadeiras ou falsas:
( ) A frequência relativa simples de adultos jovens com taxa de colesterol entre 112 mg/dL e 131 mg/dL é de 2%, bem como a frequência relativa acumulada.
( ) A frequência absoluta acumulada de adultos jovens com taxa de colesterol entre 112 mg/dL e 201 mg/dL é de 33, o que corresponde a uma frequência relativa acumulada de 70%.
( ) Trinta e oito por cento dos adultos jovens apresentaram taxa de colesterol entre 112 mg/dL e 191 mg/dL.
( ) Cem por cento dos adultos jovens apresentaram taxa de colesterol até 261 mg/dL.
A sequência CORRETA, de cima para baixo, é:
I. O coeficiente de correlação (r²) deve estar acima de 0,990.
II. O coeficiente angular deve ser igual a zero.
III. Nos testes estatísticos, deve ser utilizado um nível de significância de 5%.
IV. É esperado que o coeficiente linear seja estatisticamente diferente de zero.
V. Para avaliar se os dados são homocedásticos ou não, é recomendado aplicar o teste F da Anova.
Sobre as afirmativas acima, pode-se dizer que:
Em relação aos tipos de distribuição de probabilidade, pode-se afirmar que:
I. A distribuição de probabilidade normal é expressa por um gráfico simétrico que possui a forma de sino, também chamado de curva Gaussiana.
II. Assume-se que os dados provêm de uma distribuição retangular quando há conhecimento específico dos possíveis valores da grandeza de entrada.
III. Em geral, aplica-se a distribuição triangular em medições realizadas em instrumentos de indicação digital.
Sobre as afirmativas acima, pode-se dizer que:
import numpy as np from sklearn.model_selection import train_ test_split from sklearn.linear_model import LinearRegression from sklearn.metrics import mean_squared_error, mean_absolute_error, r2_score
X = np.array([[1, 50], [2, 60], [3, 70], [4, 80], [5, 90], [1, 55], [2, 65], [3, 75], [4, 85], [5, 95]]) y = np.array([100000, 120000, 150000, 200000, 250000, 110000, 130000, 170000, 230000, 290000]) X_train, X_test, y_train, y_test = train_ test_split(X, y, test_size=0.2, random_ state=0)
model = LinearRegression() model.fit(X_train, y_train) y_pred = model.predict(X_test)
r2 = r2_score(y_test, y_pred) mse = mean_squared_error(y_test, y_pred) rmse = np.sqrt(mse) mae = mean_absolute_error(y_test, y_pred)
print(f”R-Quadrado: {r2}, MSE: {mse}, RMSE: {rmse}, MAE: {mae}”)
Após executar o código, foram obtidas as seguintes métricas de desempenho:
R-Quadrado: 0.9020746527777778 , MSE: 156680555.5555556, R M S E : 1 2 5 1 7 . 2 1 0 3 7 4 3 4 2 8 2 3 , M A E : 10083.333333333343
Com base nessas informações, analise as observações abaixo.
I. O valor de R-Quadrado próximo de 1 indica que o modelo explica uma grande proporção da variância dos dados de financiamento. Isso sugere que o modelo tem um bom ajuste aos dados, sendo capaz de capturar uma grande parte da relação entre as variáveis independentes e a variável dependente.
II. Um valor de MSE de aproximadamente 156 milhões sugere que, em média, o quadrado dos erros das previsões do modelo em relação aos valores reais é significativo. Isso indica que o modelo tem um bom ajuste de acordo e não existem erros consideráveis nas previsões.
III. Um MAE de aproximadamente 10083 sugere que, em média, as previsões do modelo desviam cerca de 10083 unidades dos valores reais. Comparado ao RMSE, o MAE não dá um peso tão grande a erros maiores, o que sugere que o modelo pode ter um número relativamente consistente de pequenos a moderados erros de previsão.
IV.A diferença entre o RMSE e o MAE sugere que o modelo pode estar lidando com alguns outliers ou previsões particularmente imprecisas que afetam mais o RMSE, pois o RMSE penaliza mais erros maiores do que erros menores.
Sobre as afirmativas acima, pode-se dizer que: