Questões de Concurso Sobre modelos lineares em estatística

Foram encontradas 858 questões

Q3889030 Estatística
            O modelo de regressão para as duas v.a. quantitativas, X e Y, se escreve como E(Y|x) = α + βx. Para se determinar os parâmetros α e β, são feitas n observações xi e yi e, nesse caso, o modelo pode ser escrito como yi = E(Y|xi) + ei = α + βxi + ei , em que i = 1, 2, ..., n, e em que ei é o erro do modelo frente à i-ésima observação, devendo-se encontrar os valores mais prováveis para α e β, segundo algum critério, a partir das n observações de pares de valores de (X, Y).

        No caso do critério dos mínimos quadrados, segundo o qual os valores das incógnitas α e β são determinados de modo a minimizar a soma dos quadrados dos erros, é necessário, a fim de encontrar os estimadores para os parâmetros do modelo, considerar as seguintes hipóteses para as v.a. envolvidas.

1 A variável X é controlada e não está sujeita a variações aleatórias, ou seja, X é uma variável fixa.

2 Para dado valor x de X, os erros distribuem-se ao redor da média α + βx com média zero, isto é, E(ei |x) = 0.

3 Os erros têm a mesma variabilidade em torno dos níveis de X, ou seja, Var(ei |x) = σe2 , para todo i = 1, ..., n.

4 Os erros são não correlacionados.

        Para verificar se o modelo é adequado aos dados, deve-se investigar se as suposições feitas para o desenvolvimento do modelo estão satisfeitas. Para tanto, deve-se fazer a análise dos resíduos. Uma técnica aplicável é a análise gráfica, que consiste em plotar os pares (xi , êi), em que i = 1, ..., n; e êi é a diferença entre o valor observado yi e o valor previsto pelo modelo. Os gráficos a seguir ilustram situações típicas.

A partir das informações precedentes, julgue o seguinte item.


O gráfico de resíduos (a) apresenta uma situação em que a hipótese 3 é satisfeita. 

Alternativas
Q3889029 Estatística
            O modelo de regressão para as duas v.a. quantitativas, X e Y, se escreve como E(Y|x) = α + βx. Para se determinar os parâmetros α e β, são feitas n observações xi e yi e, nesse caso, o modelo pode ser escrito como yi = E(Y|xi) + ei = α + βxi + ei , em que i = 1, 2, ..., n, e em que ei é o erro do modelo frente à i-ésima observação, devendo-se encontrar os valores mais prováveis para α e β, segundo algum critério, a partir das n observações de pares de valores de (X, Y).

        No caso do critério dos mínimos quadrados, segundo o qual os valores das incógnitas α e β são determinados de modo a minimizar a soma dos quadrados dos erros, é necessário, a fim de encontrar os estimadores para os parâmetros do modelo, considerar as seguintes hipóteses para as v.a. envolvidas.

1 A variável X é controlada e não está sujeita a variações aleatórias, ou seja, X é uma variável fixa.

2 Para dado valor x de X, os erros distribuem-se ao redor da média α + βx com média zero, isto é, E(ei |x) = 0.

3 Os erros têm a mesma variabilidade em torno dos níveis de X, ou seja, Var(ei |x) = σe2 , para todo i = 1, ..., n.

4 Os erros são não correlacionados.

        Para verificar se o modelo é adequado aos dados, deve-se investigar se as suposições feitas para o desenvolvimento do modelo estão satisfeitas. Para tanto, deve-se fazer a análise dos resíduos. Uma técnica aplicável é a análise gráfica, que consiste em plotar os pares (xi , êi), em que i = 1, ..., n; e êi é a diferença entre o valor observado yi e o valor previsto pelo modelo. Os gráficos a seguir ilustram situações típicas.

A partir das informações precedentes, julgue o seguinte item.


Para que a hipótese 2 seja satisfeita, espera-se que o gráfico de resíduos apresente pontos (xi , êi) distribuídos aproximadamente em torno da reta y = α + βx.

Alternativas
Q3889028 Estatística
            O modelo de regressão para as duas v.a. quantitativas, X e Y, se escreve como E(Y|x) = α + βx. Para se determinar os parâmetros α e β, são feitas n observações xi e yi e, nesse caso, o modelo pode ser escrito como yi = E(Y|xi) + ei = α + βxi + ei , em que i = 1, 2, ..., n, e em que ei é o erro do modelo frente à i-ésima observação, devendo-se encontrar os valores mais prováveis para α e β, segundo algum critério, a partir das n observações de pares de valores de (X, Y).

        No caso do critério dos mínimos quadrados, segundo o qual os valores das incógnitas α e β são determinados de modo a minimizar a soma dos quadrados dos erros, é necessário, a fim de encontrar os estimadores para os parâmetros do modelo, considerar as seguintes hipóteses para as v.a. envolvidas.

1 A variável X é controlada e não está sujeita a variações aleatórias, ou seja, X é uma variável fixa.

2 Para dado valor x de X, os erros distribuem-se ao redor da média α + βx com média zero, isto é, E(ei |x) = 0.

3 Os erros têm a mesma variabilidade em torno dos níveis de X, ou seja, Var(ei |x) = σe2 , para todo i = 1, ..., n.

4 Os erros são não correlacionados.

        Para verificar se o modelo é adequado aos dados, deve-se investigar se as suposições feitas para o desenvolvimento do modelo estão satisfeitas. Para tanto, deve-se fazer a análise dos resíduos. Uma técnica aplicável é a análise gráfica, que consiste em plotar os pares (xi , êi), em que i = 1, ..., n; e êi é a diferença entre o valor observado yi e o valor previsto pelo modelo. Os gráficos a seguir ilustram situações típicas.

A partir das informações precedentes, julgue o seguinte item.


No modelo de regressão linear simples estimado pelo método dos mínimos quadrados ordinários (MQO), a soma dos resíduos é sempre igual a zero.

Alternativas
Q3889027 Estatística

A tabela a seguir apresenta o tempo y, em anos, que cinco clientes levam até decidir trocar de operadora de telefone, bem como sua renda mensal x, em salários mínimos.



Nesse contexto, um modelo de regressão linear na forma E(Y| x) = a + bx é construído para se ajustar aos dados por critério que minimize a soma dos quadrados dos erros.

Com base nas informações apresentadas e supondo que o modelo apresentado possa ser usado para prever o comportamento das demais pessoas, julgue o próximo item. 


Para um cliente com renda de 7 salários mínimos, o valor absoluto do erro ao se usar o modelo em questão frente ao dado amostral é superior a 2 meses.

Alternativas
Q3889026 Estatística

A tabela a seguir apresenta o tempo y, em anos, que cinco clientes levam até decidir trocar de operadora de telefone, bem como sua renda mensal x, em salários mínimos.



Nesse contexto, um modelo de regressão linear na forma E(Y| x) = a + bx é construído para se ajustar aos dados por critério que minimize a soma dos quadrados dos erros.

Com base nas informações apresentadas e supondo que o modelo apresentado possa ser usado para prever o comportamento das demais pessoas, julgue o próximo item. 


Segundo o modelo apresentado, um cliente com renda de 8 salários mínimos levará mais de 4 anos e 9 meses para decidir trocar de operadora. 

Alternativas
Q3889025 Estatística

A tabela a seguir apresenta o tempo y, em anos, que cinco clientes levam até decidir trocar de operadora de telefone, bem como sua renda mensal x, em salários mínimos.



Nesse contexto, um modelo de regressão linear na forma E(Y| x) = a + bx é construído para se ajustar aos dados por critério que minimize a soma dos quadrados dos erros.

Com base nas informações apresentadas e supondo que o modelo apresentado possa ser usado para prever o comportamento das demais pessoas, julgue o próximo item. 


Infere-se do modelo apresentado que quanto maior a renda do cliente, menor é o tempo que ele leva até decidir trocar de operadora.

Alternativas
Q3889024 Estatística

A tabela a seguir apresenta o tempo y, em anos, que cinco clientes levam até decidir trocar de operadora de telefone, bem como sua renda mensal x, em salários mínimos.



Nesse contexto, um modelo de regressão linear na forma E(Y| x) = a + bx é construído para se ajustar aos dados por critério que minimize a soma dos quadrados dos erros.

Com base nas informações apresentadas e supondo que o modelo apresentado possa ser usado para prever o comportamento das demais pessoas, julgue o próximo item. 


No modelo apresentado, o parâmetro b representa o quanto a média da variável que mensura o tempo médio que um cliente leva até decidir trocar de operadora varia para um aumento unitário na variável renda.

Alternativas
Q3887051 Estatística
        Em uma auditoria operacional, foi avaliado o custo mensal de operação (em R$ mil) de um mesmo serviço crítico de telecomunicações em três unidades administrativas (A, B e C). Foram coletadas seis observações mensais por unidade, no mesmo período e com o mesmo critério de custeio. Para verificar se havia diferença entre os custos médios populacionais dessas unidades (μAB e μC), foi aplicada análise de variância (ANOVA) ao nível de significância de 5%, com a hipótese nula  H0 = μA = μB μC .
A tabela a seguir apresenta o resultado resumido.

A partir das informações fornecidas pela situação hipotética precedente, julgue o item a seguir.


Nessa situação, não há evidências estatísticas que rejeitem a hipótese H0 ao nível de significância de 5%.

Alternativas
Q3884300 Estatística

Analisando a relação entre o tempo de experiência, em anos, e salários, em salários mínimos (SM), dos empregados em um determinado ramo de atividade, optou-se por utilizar o modelo linear simples Yiα + βti; + εi, em que Yi, é o salário do empregado i, ti é o tempo de experiência do empregado i, α e β são parâmetros desconhecidos e εi; o erro aleatório com as respectivas hipóteses do modelo de regressão linear simples. Utilizando o método dos mínimos quadrados, com base nas observações de 100 salários de empregados do ramo, obteve-se uma estimativa para o parâmetro a igual a 2. Se a soma dos salários dos empregados observados foi igual a 400 SM e a média dos respectivos tempos de experiência apresentou um valor igual a 2,5 anos, então a previsão do salário de um empregado com 8 anos de experiência é, em SM, de

Alternativas
Q3883554 Estatística
Em relação ao modelo de regressão linear simples Y = α +  βX + ε , avalie se os pressupostos a seguir estão corretos.
I. Os erros  εi são não correlacionados. II. Os erros  εi têm média 0 e variância comum σ2 . III. Os erros  εi têm distribuição Normal.
Está correto o que se pressupõe em
Alternativas
Q3883553 Estatística
Considere um modelo de regressão linear simples
Y = α + βX + ε
para o qual uma amostra aleatória simples (x1, y1), ..., (xn, yn) seja obtida.
Nesse caso, usando a notação usual, as estimativas de α e β obtidas pelo método dos mínimos quadrados serão dadas, respectivamente, por α = y̅ − βx̄ e 
Alternativas
Q3878697 Estatística
Um tribunal deseja prever o tempo de tramitação (em dias) de processos de uma determinada classe, desde a distribuição até a sentença em 1ª instância. Um cientista de dados ajustou um modelo de regressão usando variáveis como tipo de ação, vara, quantidade de partes e histórico de movimentações, e avaliou o modelo no conjunto de teste. Como métrica principal, ele calculou a soma das diferenças absolutas dividida pelo número de observações, ou: 
Erro = Captura_de Tela 2026-02-11 às 21.27.25.png (142×92) ´
obtendo  Erro = 18, que foi interpretado como: “em média, o modelo erra em 18 dias o tempo de tramitação dos processos”. A métrica utilizada pelo cientista de dados é: 
Alternativas
Q3875560 Estatística
A validação de métodos analíticos em laboratórios de alimentos exige a avaliação rigorosa de parâmetros de desempenho para garantir a confiabilidade dos resultados. Analise as afirmativas a seguir sobre os conceitos de Robustez e Homocedasticidade:

I. A Robustez de um método analítico refere-se à sua capacidade de resistir a pequenas e deliberadas variações nos parâmetros do método (como pequenas alterações de pH, temperatura ou fluxo da fase móvel), indicando sua confiabilidade durante o uso normal na rotina laboratorial.
II. A Homocedasticidade é a condição em que a variância dos erros do método é constante ao longo de toda a faixa de concentração de trabalho, sendo um pré-requisito essencial para o uso da regressão linear simples (Mínimos Quadrados Ordinários) na construção da curva de calibração.
III. Se um método apresentar Heterocedasticidade (variância não constante), deve-se utilizar obrigatoriamente a regressão linear ponderada ou transformações matemáticas nos dados, pois a regressão simples daria peso excessivo aos pontos de maior concentração que possuem maior variância absoluta.

Está correto o que se afirma em:
Alternativas
Q3874747 Estatística
Um tribunal deseja prever o tempo de tramitação (em dias) de processos de uma determinada classe, desde a distribuição até a sentença em 1ª instância. Um cientista de dados ajustou um modelo de regressão usando variáveis como tipo de ação, vara, quantidade de partes e histórico de movimentações, e avaliou o modelo no conjunto de teste.
Como métrica principal, ele calculou a soma das diferenças absolutas dividida pelo número de observações, ou: 
q_48 ima.png (162×74)

obtendo Erro = 18, que foi interpretado como: “em média, o modelo erra em 18 dias o tempo de tramitação dos processos”. A métrica utilizada pelo cientista de dados é: 
Alternativas
Q3869748 Estatística

Um tribunal deseja prever o tempo de tramitação (em dias) de processos de uma determinada classe, desde a distribuição até a sentença em 1ª instância. Um cientista de dados ajustou um modelo de regressão usando variáveis como tipo de ação, vara, quantidade de partes e histórico de movimentações, e avaliou o modelo no conjunto de teste.


Como métrica principal, ele calculou a soma das diferenças absolutas dividida pelo número de observações, ou: 


                                                                                Imagem associada para resolução da questão


obtendo Erro = 18, que foi interpretado como: “em média, o modelo erra em 18 dias o tempo de tramitação dos processos”. A métrica utilizada pelo cientista de dados é: 

Alternativas
Q3868793 Estatística
Um pesquisador montou um experimento com um delineamento em blocos ao acaso, no esquema fatorial 3 x 5, utilizando três níveis de aplicação de ureia, cinco híbridos de milho e quatro repetições (blocos). Ele iniciou a montagem da tabela de Análise de Variância, porém não inseriu os valores de Graus de Liberdade, conforme representado na Tabela a seguir.

Assinale a alternativa INCORRETА.

Tabela 2. Análise de variância do experimento sem a informação dos Graus de Liberdade, utilizando um esquema fatorial 3x 5.

Q43.png (385×213)
Alternativas
Q3853103 Estatística
A MetalMec Indústria de Componentes especializada na produção de eixos e componentes metálicos de precisão, identificou aumento no número de peças rejeitadas em suas máquinas CNC. Um inspetor de qualidade coletou, durante 10 dias, dados sobre a temperatura média das máquinas (°C) e o número de peças rejeitadas por dia, obtendo o seguinte gráfico de dispersão.


Imagem associada para resolução da questão


Com base na situação apresentada, analise as afirmações a seguir, classificando-as como verdadeiras (V) ou falsas (F).

( ) Existe uma correlação positiva forte entre a temperatura da máquina e o número de peças rejeitadas.
( ) É possível aplicar um modelo matemático para prever o número de peças rejeitadas em função da temperatura, criando-se uma equação y= a + bx, sendo y a temperatura e x o número de peças rejeitadas.
( ) A causa do aumento de peças rejeitadas é necessariamente a temperatura, e outros fatores podem ser ignorados. (
( ) Uma análise de regressão linear poderia quantificar o impacto da temperatura sobre o índice de rejeição, permitindo ações preventivas mais precisas.

A sequência correta de preenchimento dos parênteses, de cima para baixo, é 
Alternativas
Q3850249 Estatística
Um laboratório pretende comparar o valor médio de pH entre três marcas de leite comercializadas na mesma região. Foram coletadas amostras independentes de cada marca, os dados apresentaram distribuição aproximadamente normal e variâncias semelhantes entre os grupos.
Com base nessas informações, é correto afirmar que o teste estatístico mais apropriado para verificar se há diferença significativa entre as médias de pH das três marcas é
Alternativas
Q3842895 Estatística
No aprendizado de máquina, especialmente em modelos de regressão, é comum enfrentar o problema de overfitting, onde o modelo se ajusta excessivamente aos dados de treinamento, capturando ruídos e padrões irrelevantes. Para mitigar esse problema e melhorar a capacidade de generalização do modelo, algumas técnicas de regularização podem ser empregadas. Qual técnica de regularização adiciona uma penalidade proporcional ao valor absoluto dos coeficientes no cálculo da função de custo? 
Alternativas
Q3842892 Estatística
Para avaliar a eficácia de modelos de regressão, diversas métricas são utilizadas para quantificar a precisão das previsões em relação aos valores reais. A escolha da métrica adequada depende do contexto e dos objetivos específicos da análise. Compreender as características de cada métrica é essencial para interpretar corretamente o desempenho do modelo e realizar comparações apropriadas entre diferentes abordagens. Qual das seguintes opções é uma métrica comumente usada para avaliar modelos de regressão? 
Alternativas
Respostas
61: E
62: E
63: C
64: C
65: C
66: C
67: C
68: C
69: C
70: E
71: A
72: A
73: C
74: A
75: A
76: E
77: B
78: D
79: A
80: A