Na biblioteca Scipy, existem várias funções utilizadas para ...

Próximas questões
Com base no mesmo assunto
Ano: 2025 Banca: FUVEST Órgão: USP Prova: FUVEST - 2025 - USP - Analista de Sistemas |
Q3509620 Estatística
Na biblioteca Scipy, existem várias funções utilizadas para avaliar o comportamento estatístico de amostras de dados. Assinale a alternativa que descreve uma função que pode ser usada para verificar se um grande volume de dados segue uma distribuição comum, como a normal, sem exigir que os parâmetros da distribuição sejam previamente conhecidos.
Alternativas

Comentários

Veja os comentários dos nossos alunos

Esta questão aborda testes de aderência (ou testes de bondade de ajuste) dentro da biblioteca . O objetivo é identificar qual função verifica se os dados seguem uma distribuição específica (como a Normal) sem que você precise informar a média ou o desvio padrão de antemão.

  • A) Correta: O teste de Anderson-Darling é uma modificação do teste Kolmogorov-Smirnov. Ele é extremamente robusto para grandes volumes de dados e, no Scipy, permite testar contra distribuições como a Normal, Exponencial ou Logística sem conhecer os parâmetros. Ele retorna valores críticos para diferentes níveis de significância, sendo muito utilizado em contextos profissionais e acadêmicos.
  • B) Incorreta: O sufixo indica que este é o teste de Kolmogorov-Smirnov para duas amostras. Ele serve para verificar se duas amostras independentes vêm da mesma distribuição, e não para comparar uma amostra contra uma distribuição teórica (como a Normal).
  • C) Incorreta: Embora o teste de Shapiro-Wilk seja muito comum para testar a normalidade, ele é recomendado principalmente para pequenas amostras (n<5000). O enunciado menciona um "grande volume de dados", cenário onde o Shapiro-Wilk costuma apresentar limitações de performance e sensibilidade excessiva.
  • D) Incorreta: Esta função calcula o coeficiente de correlação de Pearson. Ela mede a relação linear entre duas variáveis, não tendo relação com testes de aderência de distribuição.
  • E) Incorreta: Este é o Teste t para uma amostra. Ele é usado para verificar se a média de uma amostra é significativamente diferente de uma média populacional conhecida, e não para testar o formato da distribuição.

A alternativa correta é:

A) scipy.stats.anderson()

A função implementa o teste de Anderson-Darling, que:

  • Verifica se os dados seguem uma distribuição específica (como a normal),
  • Não exige que os parâmetros da distribuição sejam previamente conhecidos,
  • É adequada para grandes volumes de dados,
  • É mais robusta que alguns outros testes de normalidade.
  • B) scipy.stats.ks_2samp():
  • Compara duas amostras, não testa aderência a uma distribuição teórica.
  • C) scipy.stats.shapiro():
  • Teste de normalidade, mas mais indicado para amostras pequenas (perde eficiência em grandes volumes).
  • D) scipy.stats.pearsonr():
  • Mede correlação, não verifica distribuição.
  • E) scipy.stats.ttest_1samp():
  • Testa média da amostra, não a forma da distribuição.

Clique para visualizar este comentário

Visualize os comentários desta questão clicando no botão abaixo