Questões de Concurso
Sobre análise multivariada em estatística
Foram encontradas 217 questões
Com base nesses dados, tem-se que
I. K-Means, DBSCAN e Gaussian Mixture Models (GMM) são métodos amplamente empregados para tarefas de clusterização, embora se baseiem em pressupostos estatísticos e geométricos distintos.
II. DBSCAN e Mean-Shift são algoritmos que não exigem a definição prévia do número de clusters, pois os identificam implicitamente, a partir da densidade dos dados ou da estimação de modos da distribuição.
III. Critérios de informação como Akaike Information Criterion (AIC) e Bayesian Information Criterion (BIC), bem como heurísticas como o método do Elbow, são utilizados como técnicas auxiliares para apoiar a escolha do número adequado de clusters em determinados algoritmos.
É (são) verdadeira(s) a(s) alternativa(s):
A técnica mais adequada para essa tarefa é:
Os valores de precisão e recall para a classe P, nessa ordem, são
No que se refere aos processos de ETL (extract, transform, load) e a técnicas de pré-processamento de dados para classificação e visualização de dados, julgue o próximo item.
A análise PCA (análise de componentes principais) é utilizada para simplificar os dados e reduzir o ruído, pois tende a equilibrar as dimensões que têm valores mais extremos (outliers).
A partir da situação anterior, assinale a opção em que é corretamente descrita a técnica mais adequada para a finalidade pretendida pelos analistas de dados em questão.
O resultado impresso é igual a
O conjunto está fortemente desbalanceado: apenas 3% dos registros pertencem à classe denominada inadimplente. O time deseja aumentar a quantidade de exemplos da classe minoritária sem simplesmente duplicar registros existentes, gerando novas amostras sintéticas entre os pontos reais da classe positiva, para reduzir o risco de overfitting associado ao oversampling ingênuo.
A técnica de balanceamento de classes adequada para esse cenário é:
Nesse caso, o procedimento estatístico mais adequado seria
Como a pesquisa ainda não tem uma variável-alvo definida, o objetivo inicial é identificar grupos latentes de usuários com padrões semelhantes de comportamento, considerando variáveis como frequência de participação, região e faixa etária. Após essa etapa, a equipe pretende avaliar os fatores que contribuem para o engajamento cultural em regiões com baixa participação e, por fim, recomendar estratégias de ampliação de acesso.
Considerando os modelos multivariados, a natureza da base de dados e os objetivos e etapas propostos para a pesquisa, a equipe responsável deveria: