Questões de Concurso
Sobre modelos lineares em estatística
Foram encontradas 858 questões
sendo
variáveis aleatórias independentes para todo para todo i = 1, ..., n. Gráfico de resíduos versus a ordem de coleta dos dados (ou a sequência de tempo) para o modelo ajustado
Esse gráfico indica que
N (0, σ2) são variáveis aleatórias independentes para todo i = 1, ..., 20.
em que "QMRegressão" e "QMResíduo” são o quadrado médio da regressão e o quadrado médio dos resíduos, foi 42 e 49, respectivamente, para
o modelo ajustado. Esses valores são utilizados para testar as hipóteses
N (0, σ2) são variáveis aleatórias independentes para todo i = 1, ..., 20.
sendo S QRegressão a soma de quadrados da regressão, é igual a
N (0, σ2) são variáveis aleatórias independentes para todo i = 1, ..., 20.
em que, para todo
as variáveis são aleatórias independentes.
em que, para todo
as variáveis são aleatórias independentes.A Empresa Delta S.A apurou os seguintes resultados sobre o aumento de custos em seus produtos:

Sendo a Equação da Reta de Regressão dada por y = a + bx, onde a = 18,02 e b=0,06, pode-se calcular que para o dia 01/06/24 a estimativa de custos será de:
I. O coeficiente de correlação (r²) deve estar acima de 0,990.
II. O coeficiente angular deve ser igual a zero.
III. Nos testes estatísticos, deve ser utilizado um nível de significância de 5%.
IV. É esperado que o coeficiente linear seja estatisticamente diferente de zero.
V. Para avaliar se os dados são homocedásticos ou não, é recomendado aplicar o teste F da Anova.
Sobre as afirmativas acima, pode-se dizer que:
import numpy as np from sklearn.model_selection import train_ test_split from sklearn.linear_model import LinearRegression from sklearn.metrics import mean_squared_error, mean_absolute_error, r2_score
X = np.array([[1, 50], [2, 60], [3, 70], [4, 80], [5, 90], [1, 55], [2, 65], [3, 75], [4, 85], [5, 95]]) y = np.array([100000, 120000, 150000, 200000, 250000, 110000, 130000, 170000, 230000, 290000]) X_train, X_test, y_train, y_test = train_ test_split(X, y, test_size=0.2, random_ state=0)
model = LinearRegression() model.fit(X_train, y_train) y_pred = model.predict(X_test)
r2 = r2_score(y_test, y_pred) mse = mean_squared_error(y_test, y_pred) rmse = np.sqrt(mse) mae = mean_absolute_error(y_test, y_pred)
print(f”R-Quadrado: {r2}, MSE: {mse}, RMSE: {rmse}, MAE: {mae}”)
Após executar o código, foram obtidas as seguintes métricas de desempenho:
R-Quadrado: 0.9020746527777778 , MSE: 156680555.5555556, R M S E : 1 2 5 1 7 . 2 1 0 3 7 4 3 4 2 8 2 3 , M A E : 10083.333333333343
Com base nessas informações, analise as observações abaixo.
I. O valor de R-Quadrado próximo de 1 indica que o modelo explica uma grande proporção da variância dos dados de financiamento. Isso sugere que o modelo tem um bom ajuste aos dados, sendo capaz de capturar uma grande parte da relação entre as variáveis independentes e a variável dependente.
II. Um valor de MSE de aproximadamente 156 milhões sugere que, em média, o quadrado dos erros das previsões do modelo em relação aos valores reais é significativo. Isso indica que o modelo tem um bom ajuste de acordo e não existem erros consideráveis nas previsões.
III. Um MAE de aproximadamente 10083 sugere que, em média, as previsões do modelo desviam cerca de 10083 unidades dos valores reais. Comparado ao RMSE, o MAE não dá um peso tão grande a erros maiores, o que sugere que o modelo pode ter um número relativamente consistente de pequenos a moderados erros de previsão.
IV.A diferença entre o RMSE e o MAE sugere que o modelo pode estar lidando com alguns outliers ou previsões particularmente imprecisas que afetam mais o RMSE, pois o RMSE penaliza mais erros maiores do que erros menores.
Sobre as afirmativas acima, pode-se dizer que:
Y=β0+β1 X+β2 X²+ε
Diante disto, assinale a alternativa que apresenta uma afirmação correta sobre esta regressão polinomial.
Um dos tipos de indicadores de performance diagnóstica utilizado na área da saúde é a verificação matemática de como duas ou mais variáveis se relacionam e representam um recurso útil para a tomada de decisão ao permitir a identificação dos fatores que trazem mais impacto a uma determinada questão de saúde. Esse modelo tem o intuito de realizar previsões sobre o comportamento de algum fenômeno ou determinar os efeitos sobre a variável resposta ou de interesse em decorrência de alterações introduzidas nas covariáveis.
Esse tipo de indicador refere-se