São vários os procedimentos para a busca do “subconjunto óti...

Com base no mesmo assunto

Ano: 2024 Banca: VUNESP Órgão: EsFCEx Prova: VUNESP - 2024 - EsFCEx - Oficial - Estatística |

Q3266532 Estatística

São vários os procedimentos para a busca do “subconjunto ótimo” de variáveis, na ausência da ortogonalidade, para obter uma equação de estimação adequada que relaciona uma variável Y a todas ou a um subconjunto de variáveis independentes. Considere o seguinte procedimento:

PASSO 1: Escolha a variável que fornece a maior soma de quadrados da regressão em regressão linear simples com Y ou, de maneira equivalente, que forneça o maior valor de R². Chamaremos essa variável inicial de X₁.

PASSO 2: Escolha a variável que, quando inserida no modelo, fornece o maior aumento em R², na presença de X₁, sobre o valor de R² encontrado no passo 1, isto é, a variável X_j para a qual:
R(β_j |β₁) = R(β₁, β_j) – R(β₁)
é maior. Vamos chamá-la de variável X₂. O modelo de regressão com X₁ e X₂ é, então, ajustado e R² é observado.

PASSO 3: Escolha a variável Xj que fornece o maior valor de:
R(β_j |β₁, β₂) = R(β₁, β₂, β_j) – R(β₁, β₂),
resultando novamente em um aumento em R² sobre aquele dado no PASSO 2. Ao chamar essa variável de X₃, agora temos um modelo de regressão que envolve X₁, X₂ e X₃. Esse processo é continuado até que a variável inserida mais recentemente falhe ao produzir um aumento significativo na regressão explicada. Tal aumento pode ser determinado em cada passo, devendo-se usar o teste F (ou t) apropriado.

Por exemplo, no PASSO 2, o valor: Captura_de tela 2025-03-28 081059.png (142×33)

Captura_de tela 2025-03-28 081059.png (142×33)

pode ser determinado para testar a adequação de X₂ no modelo. De maneira similar, no PASSO 3 a razão: Captura_de tela 2025-03-28 081107.png (173×38)

testa a adequação de X₃ no modelo.

Se f < f(_{1, n-3; α)} no PASSO 2, para um nível de significância preestabelecido, X₂ não é incluído e o processo é encerrado, resultando em uma equação linear simples que relaciona Y e X₁.

Contudo, se f >f_{(1, n-3; α)} deve-se seguir para o PASSO 3. Novamente, se f < f_{(1, n-4; α)} no PASSO 3, X₃ não é incluído e o processo é encerrado com a equação de regressão apropriada que contém as variáveis X₁ e X₂.

Notações utilizadas:
R² é o coeficiente de determinação do modelo de regressão;
R(.) é a soma dos quadrados do modelo de regressão em questão;
β_j é o coeficiente do modelo de regressão que acompanha a variável X_j;
A notação ‘|’ indica a probabilidade condicional;
Captura_de tela 2025-03-28 081130.png (39×31)

Captura_de tela 2025-03-28 081130.png (39×31)

é o quadrado do erro médio para o modelo que contém as variáveis X₁ e X₂;
Captura_de tela 2025-03-28 081141.png (47×32)

é o quadrado do erro médio para o modelo que contém as variáveis X₁, X₂ e X₃.

Essa descrição se refere ao método de seleção de variáveis:

Forward (‘para frente’).

Lasso bayesiano (BLASSO).

Multicolinearidade.

Bootstrap.

Backward (‘para trás’).

Você errou! Resposta:

teste

Parabéns! Você acertou!

teste

Quer um estudo ilimitado?

Quer um estudo ilimitado?

São vários os procedimentos para a busca do “subconjunto óti...

Questões de assuntos semelhantes

Provas relacionadas