Questões de Concurso Para estatística

Foram encontradas 13.775 questões

Resolva questões gratuitamente!

Junte-se a mais de 4 milhões de concurseiros!

Q3621416 Estatística
A validade das inferências em um modelo de regressão linear depende da satisfação de certos pressupostos sobre os erros do modelo. Acerca da verificação desses pressupostos, registre V, para as afirmativas verdadeiras, e F, para as falsas:

(__)A homocedasticidade, pressuposto de que a variância dos erros é constante, é verificada por meio do Fator de Inflação de Variância (VIF), onde valores de VIF acima de 10 indicam a presença de heterocedasticidade.
(__)A normalidade dos resíduos pode ser avaliada graficamente por meio de um gráfico Q-Q (quantil-quantil), no qual a proximidade dos pontos a uma linha reta sugere que os resíduos seguem uma distribuição normal.
(__)A presença de multicolinearidade severa entre as variáveis preditoras invalida a capacidade preditiva do modelo de regressão, resultando em um valor de R² ajustado próximo de zero.
(__)O pressuposto de linearidade implica que a relação entre cada variável preditora e a variável resposta é linear. Uma violação deste pressuposto pode ser detectada analisando o gráfico de resíduos versus valores ajustados em busca de padrões não aleatórios, como uma curvatura.

Após análise, assinale a alternativa que apresenta a sequência correta dos itens acima, de cima para baixo:
Alternativas
Q3621415 Estatística
Um estatístico está construindo um modelo preditivo com um número muito grande de variáveis preditoras (p > n), muitas das quais são provavelmente irrelevantes e correlacionadas entre si. O objetivo é criar um modelo parcimonioso, que realize a seleção de variáveis e a regularização simultaneamente para evitar o superajuste (overfitting). Qual das seguintes técnicas de modelagem é a mais adequada para este propósito específico?
Alternativas
Q3621414 Estatística
A independência de eventos é um conceito-chave em probabilidade, indicando que a ocorrência de um evento não influencia a probabilidade de ocorrência de outro. Assinale a alternativa que define matematicamente a condição para que dois eventos, A e B, sejam considerados independentes.
Alternativas
Q3621413 Estatística
Uma indústria farmacêutica desenvolve um novo medicamento e realiza um teste de hipóteses para verificar se ele é mais eficaz que o placebo. A hipótese nula (H0) é "o novo medicamento não tem efeito (eficácia igual ao placebo)", e a hipótese alternativa (H1) é "o novo medicamento tem efeito (eficácia maior que o placebo)". Após a análise dos dados, o estudo conclui por rejeitar H 0. Qual das situações a seguir descreve a ocorrência de um Erro Tipo I neste contexto? 
Alternativas
Q3621412 Estatística
Diferentes distribuições de probabilidade modelam diferentes tipos de experimentos aleatórios. Acerca das distribuições discretas, registre V, para as afirmativas verdadeiras, e F, para as falsas:

(__)A distribuição Binomial é adequada para modelar o número de sucessos em um número fixo de ensaios de Bernoulli independentes, onde a probabilidade de sucesso (p) permanece constante em cada ensaio.
(__)A distribuição Hipergeométrica é uma generalização da Binomial para casos em que os ensaios são dependentes, como em amostragens com reposição de uma população finita.
(__)A distribuição de Poisson é frequentemente usada para modelar o número de ocorrências de um evento raro ao longo de um intervalo especificado de tempo, área ou volume.
(__)Na distribuição Hipergeométrica, a probabilidade de sucesso em um ensaio depende dos resultados dos ensaios anteriores, o que é característico de uma amostragem sem reposição.

Após análise, assinale a alternativa que apresenta a sequência correta dos itens acima, de cima para baixo: 
Alternativas
Q3621411 Estatística
A regressão logística é uma técnica fundamental para modelar a relação entre um conjunto de variáveis preditoras e uma variável resposta categórica binária. A interpretação de seus coeficientes e a avaliação do modelo requerem métricas específicas. Considerando a aplicação e a interpretação de um modelo de regressão logística, analise as afirmativas a seguir.

I.O coeficiente ( β) de uma variável preditora contínua no modelo logístico representa a mudança no logaritmo da razão de chances (log odds) para cada aumento de uma unidade na variável preditora, mantendo as outras variáveis constantes.
II.A exponencial do coeficiente (exp(β )), conhecida como "odds ratio" ou razão de chances, indica o fator pelo qual as chances de ocorrência do evento de interesse são multiplicadas para cada aumento de uma unidade na variável preditora.
III.A avaliação do ajuste de um modelo logístico não utiliza o R² da regressão linear, mas sim pseudo-R² (como o de McFadden ou Nagelkerke) e a estatística de Hosmer-Lemeshow, que compara as probabilidades previstas com as observadas em grupos.

Está correto o que se afirma em:
Alternativas
Q3621410 Estatística
Os testes de hipóteses são procedimentos formais para tomar decisões sobre parâmetros populacionais com base em dados amostrais. A escolha do teste estatístico adequado depende do parâmetro de interesse e das características da amostra. Acerca desses testes, registre V, para as afirmativas verdadeiras, e F, para as falsas:

(__)Para comparar a média de uma amostra pequena (n < 30) com uma média populacional conhecida, sendo a variância populacional desconhecida, o teste estatístico mais apropriado é o teste Z.
(__)Em um teste de hipóteses para uma proporção populacional, a hipótese nula (H 0: p = p 0) é testada utilizando-se uma estatística de teste que, para amostras grandes, segue aproximadamente uma distribuição normal padrão.
(__)O p-valor (ou nível descritivo) de um teste de hipóteses representa a probabilidade de se observar um resultado tão ou mais extremo que o obtido na amostra, assumindo que a hipótese nula seja verdadeira.
(__)Para comparar as variâncias de duas populações normais independentes, utiliza-se o teste Qui-quadrado ( χ²), que avalia a razão entre as variâncias amostrais.

Após análise, assinale a alternativa que apresenta a sequência correta dos itens acima, de cima para baixo:
Alternativas
Q3621409 Estatística
O poder de um teste estatístico é a probabilidade de se rejeitar corretamente uma hipótese nula falsa, sendo um conceito crucial no planejamento de experimentos para evitar conclusões falso-negativas. Vários fatores influenciam o poder de um teste. Assinale a alternativa que descreve corretamente a relação entre o poder do teste e outros elementos do planejamento estatístico.
Alternativas
Q3621408 Estatística
As técnicas de amostragem são procedimentos utilizados para selecionar uma parte representativa de uma população para estudo. Acerca do assunto, registre V, para as afirmativas verdadeiras, e F, para as falsas:

(__)A amostragem por conveniência é um tipo de amostragem probabilística, pois todos os indivíduos da população têm uma probabilidade conhecida e diferente de zero de serem selecionados.
(__)Na amostragem estratificada, a população é dividida em subgrupos homogêneos denominados estratos, e uma amostra é retirada de cada estrato, garantindo a representatividade de cada subgrupo.
(__)A amostragem casual simples consiste em selecionar a amostra com base na ordenação natural da população, como uma lista telefônica, selecionando um ponto de partida aleatório e, a partir dele, cada k-ésimo elemento. 
(__)A amostragem sistemática é um método probabilístico utilizado quando a população está naturalmente ordenada, como em fichas de cadastramento.

Após análise, assinale a alternativa que apresenta a sequência correta dos itens acima, de cima para baixo:
Alternativas
Q3621407 Estatística
A probabilidade condicional e o Teorema de Bayes são ferramentas essenciais para atualizar nossas crenças sobre a ocorrência de eventos com base em novas informações. Sobre estes conceitos, analise as afirmativas a seguir:

I.A probabilidade condicional de A dado B, P(A|B), é definida como a probabilidade da união de A e B, dividida pela probabilidade de B.
II.O Teorema de Bayes é aplicável apenas a eventos independentes, pois sua fórmula se baseia na premissa de que a ocorrência de um evento não altera a probabilidade do outro.
III.A regra do produto, P(A ∩ B) = P(A | B) P(B), é uma consequência direta da definição de probabilidade condicional e é válida para quaisquer eventos A e B.

Está correto o que se afirma em:
Alternativas
Q3621406 Estatística
Um Estatístico do setor público está planejando uma pesquisa sobre as condições socioeconômicas e de saúde dos funcionários de uma secretaria. No questionário, constam as seguintes variáveis: (1) Cargo ocupado (ex: Analista, Técnico, Assessor); (2) Temperatura corporal em graus Celsius; (3) Ano de nascimento; (4) Salário mensal em Reais (R$). Ao analisar a variável "Salário mensal", o estatístico precisa definir sua escala de medição para determinar as operações estatísticas aplicáveis. A correta classificação da variável "Salário mensal" quanto à sua escala de medição é:
Alternativas
Q3621405 Estatística
A correta distinção entre população e amostra é a base para qualquer estudo estatístico, determinando o alcance e a validade das conclusões. Acerca do assunto, registre V, para as afirmativas verdadeiras, e F, para as falsas:

(__)Parâmetro é uma medida numérica que descreve uma característica de uma amostra, sendo utilizado para estimar o valor correspondente na população.
(__)Amostra é o conjunto de todos os elementos que possuem pelo menos uma característica em comum a ser estudada, sobre o qual se deseja fazer inferências.
(__)Censo é uma técnica especial usada para recolher amostras que garante o acaso na escolha, de modo a garantir o caráter de representatividade.
(__)População é um conjunto de elementos com pelo menos uma característica em comum, que deve delimitar inequivocamente quais os elementos pertencem a ela e quais não.

Após análise, assinale a alternativa que apresenta a sequência correta dos itens acima:
Alternativas
Q3621404 Estatística
A Análise de Agrupamento (ou Cluster Analysis) é uma técnica exploratória utilizada para identificar grupos de observações ou variáveis que sejam homogêneos internamente e heterogêneos entre si. Sobre os métodos e conceitos dessa técnica, analise as afirmativas a seguir:

I.Os métodos de agrupamento hierárquico, como o de Ward ou o da ligação completa (complete linkage), não exigem a pré-especificação do número de clusters e o resultado é tipicamente visualizado em um dendrograma, que mostra a sequência de fusões ou divisões dos grupos.
II.O método não hierárquico K-médias (K-means) é ideal para dados que contêm variáveis categóricas e outliers, pois o algoritmo é robusto a esses fatores e utiliza a distância de Manhattan como padrão.
III.No método de agrupamento hierárquico de ligação simples (single linkage), a distância entre dois clusters é definida pela distância entre os dois pontos mais distantes de cada cluster, o que tende a formar grupos esféricos e compactos.

Está correto o que se afirma em:
Alternativas
Q3621403 Estatística
Um pesquisador de marketing deseja prever a probabilidade de um cliente adquirir ou não um novo serviço (variável resposta binária: "compra" vs. "não compra"), com base em um conjunto de variáveis preditoras contínuas e categóricas (idade, renda, histórico de compras, etc.). Além disso, ele quer interpretar como cada variável preditora afeta as chances de compra. Qual técnica estatística multivariada é a mais adequada para este problema de classificação e interpretação?
Alternativas
Q3621402 Estatística
A análise de resíduos é uma etapa diagnóstica crucial na modelagem de regressão, permitindo a verificação dos pressupostos e a identificação de observações atípicas. Diferentes tipos de resíduos são calculados para diferentes finalidades. Assinale a alternativa que descreve corretamente o conceito e a utilidade dos resíduos studentizados (studentized residuals). 
Alternativas
Q3621401 Estatística
A padronização, ou cálculo do escore-z, é uma transformação estatística fundamental que permite comparar valores de diferentes distribuições normais. Acerca do conceito e da interpretação do escore-z, registre V, para as afirmativas verdadeiras, e F, para as falsas:

(__)O escore-z de um valor é calculado pela razão entre o valor e a média da distribuição (z=x/μ ), resultando em uma medida adimensional de sua magnitude absoluta.
(__)Um escore-z de 0 indica que o valor observado é exatamente igual à média da distribuição.
(__)A padronização transforma qualquer distribuição normal com média μ e desvio padrão σ em uma distribuição normal padrão com média 0 e desvio padrão 1.
(__)Um valor com escore-z de -2,5 está localizado a 2,5 desvios padrão abaixo da média de sua distribuição original.

Após análise, assinale a alternativa que apresenta a sequência correta dos itens acima:
Alternativas
Q3621400 Estatística
A classificação correta das variáveis de uma pesquisa é fundamental para a escolha dos métodos de análise estatística adequados. Sobre os tipos de variáveis, analise as afirmativas a seguir:

I.A variável "número de filhos" é classificada como quantitativa discreta, pois assume valores pertencentes a um conjunto enumerável e resulta de uma contagem.
II.A variável qualitativa ordinal, como "grau de escolaridade", permite que a distância entre suas categorias seja quantificada, possibilitando cálculos como a média das categorias.
III.A variável "curso de graduação" é classificada como qualitativa nominal, pois seus valores são expressos por atributos sem uma ordem ou hierarquia natural.

Está correto o que se afirma em:
Alternativas
Q3621399 Estatística
A Análise Fatorial (AF) e a Análise de Componentes Principais (ACP) são técnicas multivariadas de redução de dimensionalidade, mas que partem de pressupostos e objetivos distintos. Acerca das características e diferenças entre AF e ACP, registre V, para as afirmativas verdadeiras, e F, para as falsas:

(__)Tanto a Análise Fatorial quanto a Análise de Componentes Principais são modelos matemáticos idênticos que buscam explicar a variância total das variáveis observadas, sendo os termos "fator" e "componente principal" sinônimos.
(__)Na Análise de Componentes Principais (ACP), os componentes são combinações lineares das variáveis originais e são assumidos como as causas latentes que geram as correlações entre essas variáveis.
(__)A Análise Fatorial é uma técnica mais indicada quando o objetivo é apenas a redução de dados para uso em análises subsequentes, sem a necessidade de uma interpretação teórica das dimensões subjacentes.
(__)Na Análise de Componentes Principais (ACP), os componentes principais são calculados de forma a serem ortogonais (não correlacionados) entre si, e o primeiro componente principal é a combinação linear das variáveis originais que captura a maior quantidade possível da variância total dos dados.

Após análise, assinale a alternativa que apresenta a sequência correta dos itens acima, de cima para baixo:
Alternativas
Q3621398 Estatística
As medidas de tendência central são usadas para resumir um conjunto de dados em um único valor que represente o centro da distribuição. Considerando as propriedades e aplicações da média, moda e mediana, analise as afirmativas a seguir:
I.A mediana é uma medida de tendência central que não é afetada por valores extremos (discrepantes) em um conjunto de dados, tornando-a preferível à média em distribuições muito assimétricas.
II.A média aritmética possui a propriedade de que a soma algébrica dos desvios de cada valor em relação a ela é sempre nula.
III.Em uma distribuição com dados agrupados em classes, a moda (moda bruta) é calculada como o ponto médio da classe que possui a menor frequência absoluta.

Está correto o que se afirma em:
Alternativas
Q3621397 Estatística
As medidas de dispersão quantificam o grau de variabilidade ou espalhamento dos dados em torno de uma medida de tendência central. Acerca do assunto, registre V, para as afirmativas verdadeiras, e F, para as falsas:

(__)O desvio padrão é expresso na mesma unidade de medida dos dados originais, sendo a raiz quadrada positiva da variância.
(__)A amplitude total é a medida de dispersão mais robusta, pois considera todos os valores da distribuição para seu cálculo, não sendo influenciada por valores extremos.
(__)A variância pode assumir valores negativos caso a maioria dos dados esteja abaixo da média, indicando uma dispersão negativa.
(__)O coeficiente de variação é uma medida de dispersão relativa, útil para comparar a variabilidade de dois ou mais conjuntos de dados com médias e unidades de medida diferentes.

Após análise, assinale a alternativa que apresenta a sequência correta dos itens acima, de cima para baixo:
Alternativas
Respostas
821: C
822: D
823: C
824: C
825: E
826: A
827: E
828: E
829: C
830: B
831: D
832: E
833: C
834: C
835: B
836: A
837: B
838: B
839: E
840: C