Questões de Concurso
Para estatística
Foram encontradas 13.775 questões
Resolva questões gratuitamente!
Junte-se a mais de 4 milhões de concurseiros!
(__)A homocedasticidade, pressuposto de que a variância dos erros é constante, é verificada por meio do Fator de Inflação de Variância (VIF), onde valores de VIF acima de 10 indicam a presença de heterocedasticidade.
(__)A normalidade dos resíduos pode ser avaliada graficamente por meio de um gráfico Q-Q (quantil-quantil), no qual a proximidade dos pontos a uma linha reta sugere que os resíduos seguem uma distribuição normal.
(__)A presença de multicolinearidade severa entre as variáveis preditoras invalida a capacidade preditiva do modelo de regressão, resultando em um valor de R² ajustado próximo de zero.
(__)O pressuposto de linearidade implica que a relação entre cada variável preditora e a variável resposta é linear. Uma violação deste pressuposto pode ser detectada analisando o gráfico de resíduos versus valores ajustados em busca de padrões não aleatórios, como uma curvatura.
Após análise, assinale a alternativa que apresenta a sequência correta dos itens acima, de cima para baixo:
(__)A distribuição Binomial é adequada para modelar o número de sucessos em um número fixo de ensaios de Bernoulli independentes, onde a probabilidade de sucesso (p) permanece constante em cada ensaio.
(__)A distribuição Hipergeométrica é uma generalização da Binomial para casos em que os ensaios são dependentes, como em amostragens com reposição de uma população finita.
(__)A distribuição de Poisson é frequentemente usada para modelar o número de ocorrências de um evento raro ao longo de um intervalo especificado de tempo, área ou volume.
(__)Na distribuição Hipergeométrica, a probabilidade de sucesso em um ensaio depende dos resultados dos ensaios anteriores, o que é característico de uma amostragem sem reposição.
Após análise, assinale a alternativa que apresenta a sequência correta dos itens acima, de cima para baixo:
I.O coeficiente ( β) de uma variável preditora contínua no modelo logístico representa a mudança no logaritmo da razão de chances (log odds) para cada aumento de uma unidade na variável preditora, mantendo as outras variáveis constantes.
II.A exponencial do coeficiente (exp(β )), conhecida como "odds ratio" ou razão de chances, indica o fator pelo qual as chances de ocorrência do evento de interesse são multiplicadas para cada aumento de uma unidade na variável preditora.
III.A avaliação do ajuste de um modelo logístico não utiliza o R² da regressão linear, mas sim pseudo-R² (como o de McFadden ou Nagelkerke) e a estatística de Hosmer-Lemeshow, que compara as probabilidades previstas com as observadas em grupos.
Está correto o que se afirma em:
(__)Para comparar a média de uma amostra pequena (n < 30) com uma média populacional conhecida, sendo a variância populacional desconhecida, o teste estatístico mais apropriado é o teste Z.
(__)Em um teste de hipóteses para uma proporção populacional, a hipótese nula (H 0: p = p 0) é testada utilizando-se uma estatística de teste que, para amostras grandes, segue aproximadamente uma distribuição normal padrão.
(__)O p-valor (ou nível descritivo) de um teste de hipóteses representa a probabilidade de se observar um resultado tão ou mais extremo que o obtido na amostra, assumindo que a hipótese nula seja verdadeira.
(__)Para comparar as variâncias de duas populações normais independentes, utiliza-se o teste Qui-quadrado ( χ²), que avalia a razão entre as variâncias amostrais.
Após análise, assinale a alternativa que apresenta a sequência correta dos itens acima, de cima para baixo:
(__)A amostragem por conveniência é um tipo de amostragem probabilística, pois todos os indivíduos da população têm uma probabilidade conhecida e diferente de zero de serem selecionados.
(__)Na amostragem estratificada, a população é dividida em subgrupos homogêneos denominados estratos, e uma amostra é retirada de cada estrato, garantindo a representatividade de cada subgrupo.
(__)A amostragem casual simples consiste em selecionar a amostra com base na ordenação natural da população, como uma lista telefônica, selecionando um ponto de partida aleatório e, a partir dele, cada k-ésimo elemento.
(__)A amostragem sistemática é um método probabilístico utilizado quando a população está naturalmente ordenada, como em fichas de cadastramento.
Após análise, assinale a alternativa que apresenta a sequência correta dos itens acima, de cima para baixo:
I.A probabilidade condicional de A dado B, P(A|B), é definida como a probabilidade da união de A e B, dividida pela probabilidade de B.
II.O Teorema de Bayes é aplicável apenas a eventos independentes, pois sua fórmula se baseia na premissa de que a ocorrência de um evento não altera a probabilidade do outro.
III.A regra do produto, P(A ∩ B) = P(A | B) P(B), é uma consequência direta da definição de probabilidade condicional e é válida para quaisquer eventos A e B.
Está correto o que se afirma em:
(__)Parâmetro é uma medida numérica que descreve uma característica de uma amostra, sendo utilizado para estimar o valor correspondente na população.
(__)Amostra é o conjunto de todos os elementos que possuem pelo menos uma característica em comum a ser estudada, sobre o qual se deseja fazer inferências.
(__)Censo é uma técnica especial usada para recolher amostras que garante o acaso na escolha, de modo a garantir o caráter de representatividade.
(__)População é um conjunto de elementos com pelo menos uma característica em comum, que deve delimitar inequivocamente quais os elementos pertencem a ela e quais não.
Após análise, assinale a alternativa que apresenta a sequência correta dos itens acima:
I.Os métodos de agrupamento hierárquico, como o de Ward ou o da ligação completa (complete linkage), não exigem a pré-especificação do número de clusters e o resultado é tipicamente visualizado em um dendrograma, que mostra a sequência de fusões ou divisões dos grupos.
II.O método não hierárquico K-médias (K-means) é ideal para dados que contêm variáveis categóricas e outliers, pois o algoritmo é robusto a esses fatores e utiliza a distância de Manhattan como padrão.
III.No método de agrupamento hierárquico de ligação simples (single linkage), a distância entre dois clusters é definida pela distância entre os dois pontos mais distantes de cada cluster, o que tende a formar grupos esféricos e compactos.
Está correto o que se afirma em:
(__)O escore-z de um valor é calculado pela razão entre o valor e a média da distribuição (z=x/μ ), resultando em uma medida adimensional de sua magnitude absoluta.
(__)Um escore-z de 0 indica que o valor observado é exatamente igual à média da distribuição.
(__)A padronização transforma qualquer distribuição normal com média μ e desvio padrão σ em uma distribuição normal padrão com média 0 e desvio padrão 1.
(__)Um valor com escore-z de -2,5 está localizado a 2,5 desvios padrão abaixo da média de sua distribuição original.
Após análise, assinale a alternativa que apresenta a sequência correta dos itens acima:
I.A variável "número de filhos" é classificada como quantitativa discreta, pois assume valores pertencentes a um conjunto enumerável e resulta de uma contagem.
II.A variável qualitativa ordinal, como "grau de escolaridade", permite que a distância entre suas categorias seja quantificada, possibilitando cálculos como a média das categorias.
III.A variável "curso de graduação" é classificada como qualitativa nominal, pois seus valores são expressos por atributos sem uma ordem ou hierarquia natural.
Está correto o que se afirma em:
(__)Tanto a Análise Fatorial quanto a Análise de Componentes Principais são modelos matemáticos idênticos que buscam explicar a variância total das variáveis observadas, sendo os termos "fator" e "componente principal" sinônimos.
(__)Na Análise de Componentes Principais (ACP), os componentes são combinações lineares das variáveis originais e são assumidos como as causas latentes que geram as correlações entre essas variáveis.
(__)A Análise Fatorial é uma técnica mais indicada quando o objetivo é apenas a redução de dados para uso em análises subsequentes, sem a necessidade de uma interpretação teórica das dimensões subjacentes.
(__)Na Análise de Componentes Principais (ACP), os componentes principais são calculados de forma a serem ortogonais (não correlacionados) entre si, e o primeiro componente principal é a combinação linear das variáveis originais que captura a maior quantidade possível da variância total dos dados.
Após análise, assinale a alternativa que apresenta a sequência correta dos itens acima, de cima para baixo:
I.A mediana é uma medida de tendência central que não é afetada por valores extremos (discrepantes) em um conjunto de dados, tornando-a preferível à média em distribuições muito assimétricas.
II.A média aritmética possui a propriedade de que a soma algébrica dos desvios de cada valor em relação a ela é sempre nula.
III.Em uma distribuição com dados agrupados em classes, a moda (moda bruta) é calculada como o ponto médio da classe que possui a menor frequência absoluta.
Está correto o que se afirma em:
(__)O desvio padrão é expresso na mesma unidade de medida dos dados originais, sendo a raiz quadrada positiva da variância.
(__)A amplitude total é a medida de dispersão mais robusta, pois considera todos os valores da distribuição para seu cálculo, não sendo influenciada por valores extremos.
(__)A variância pode assumir valores negativos caso a maioria dos dados esteja abaixo da média, indicando uma dispersão negativa.
(__)O coeficiente de variação é uma medida de dispersão relativa, útil para comparar a variabilidade de dois ou mais conjuntos de dados com médias e unidades de medida diferentes.
Após análise, assinale a alternativa que apresenta a sequência correta dos itens acima, de cima para baixo: