Na biblioteca Scipy, existem várias funções utilizadas para ...
Comentários
Veja os comentários dos nossos alunos
Esta questão aborda testes de aderência (ou testes de bondade de ajuste) dentro da biblioteca . O objetivo é identificar qual função verifica se os dados seguem uma distribuição específica (como a Normal) sem que você precise informar a média ou o desvio padrão de antemão.
- A) Correta: O teste de Anderson-Darling é uma modificação do teste Kolmogorov-Smirnov. Ele é extremamente robusto para grandes volumes de dados e, no Scipy, permite testar contra distribuições como a Normal, Exponencial ou Logística sem conhecer os parâmetros. Ele retorna valores críticos para diferentes níveis de significância, sendo muito utilizado em contextos profissionais e acadêmicos.
- B) Incorreta: O sufixo indica que este é o teste de Kolmogorov-Smirnov para duas amostras. Ele serve para verificar se duas amostras independentes vêm da mesma distribuição, e não para comparar uma amostra contra uma distribuição teórica (como a Normal).
- C) Incorreta: Embora o teste de Shapiro-Wilk seja muito comum para testar a normalidade, ele é recomendado principalmente para pequenas amostras (n<5000). O enunciado menciona um "grande volume de dados", cenário onde o Shapiro-Wilk costuma apresentar limitações de performance e sensibilidade excessiva.
- D) Incorreta: Esta função calcula o coeficiente de correlação de Pearson. Ela mede a relação linear entre duas variáveis, não tendo relação com testes de aderência de distribuição.
- E) Incorreta: Este é o Teste t para uma amostra. Ele é usado para verificar se a média de uma amostra é significativamente diferente de uma média populacional conhecida, e não para testar o formato da distribuição.
A alternativa correta é:
A) scipy.stats.anderson()
A função implementa o teste de Anderson-Darling, que:
- Verifica se os dados seguem uma distribuição específica (como a normal),
- Não exige que os parâmetros da distribuição sejam previamente conhecidos,
- É adequada para grandes volumes de dados,
- É mais robusta que alguns outros testes de normalidade.
- B) scipy.stats.ks_2samp():
- Compara duas amostras, não testa aderência a uma distribuição teórica.
- C) scipy.stats.shapiro():
- Teste de normalidade, mas mais indicado para amostras pequenas (perde eficiência em grandes volumes).
- D) scipy.stats.pearsonr():
- Mede correlação, não verifica distribuição.
- E) scipy.stats.ttest_1samp():
- Testa média da amostra, não a forma da distribuição.
Clique para visualizar este comentário
Visualize os comentários desta questão clicando no botão abaixo