Questões de Concurso Sobre estatística
Foram encontradas 14.284 questões
Com base nas boas práticas de avaliação de modelos de aprendizado de máquina, inclusive em cenários com classes desbalanceadas, analise as afirmativas a seguir, considerando (V) para a(s) afirmativa(s) verdadeira(s) e (F) para a(s) falsa(s).
( ) Na validação cruzada k-fold estratificada, cada partição de treino e teste preserva aproximadamente a mesma proporção de classes do conjunto original, o que contribui para estimativas de desempenho mais estáveis em problemas com desbalanceamento de classes.
( ) Curvas ROC e a métrica AUC-ROC são tipicamente mais informativas do que curvas precision-recall em cenários com classes fortemente desbalanceadas, justamente porque destacam com maior sensibilidade o comportamento do classificador em relação à classe minoritária.
( ) A métrica F1-score corresponde ao dobro do produto entre precisão (precision) e sensibilidade (recall) dividido pela soma de ambos, de modo que valores muito discrepantes entre precisão e recall tendem a produzir um F1-score relativamente baixo.
( ) Ao diminuir o limiar de decisão de um classificador binário (por exemplo, de 0,7 para 0,3), a precisão tende a aumentar, pois mais exemplos positivos são corretamente identificados como tal, ainda que isso geralmente ocorra às custas de uma redução no recall.
A sequência correta é:
Como métrica principal, ele calculou a soma das diferenças absolutas dividida pelo número de observações, ou:
obtendo Erro = 18, que foi interpretado como: “em média, o modelo erra em 18 dias o tempo de tramitação dos processos”. A métrica utilizada pelo cientista de dados é:
Considere o conjunto populacional: 2, 4, 8, 10. Em seguida, assinale a alternativa que contém CORRETAMENTE o valor da variância do conjunto.
O conjunto está fortemente desbalanceado: apenas 3% dos registros pertencem à classe denominada inadimplente. O time deseja aumentar a quantidade de exemplos da classe minoritária sem simplesmente duplicar registros existentes, gerando novas amostras sintéticas entre os pontos reais da classe positiva, para reduzir o risco de overfitting associado ao oversampling ingênuo.
A técnica de balanceamento de classes adequada para esse cenário é:
A avaliação dessa metodologia de validação é:
Um tribunal deseja prever o tempo de tramitação (em dias) de processos de uma determinada classe, desde a distribuição até a sentença em 1ª instância. Um cientista de dados ajustou um modelo de regressão usando variáveis como tipo de ação, vara, quantidade de partes e histórico de movimentações, e avaliou o modelo no conjunto de teste.
Como métrica principal, ele calculou a soma das diferenças absolutas dividida pelo número de observações, ou:

obtendo Erro = 18, que foi interpretado como: “em média, o modelo erra em 18 dias o tempo de tramitação dos processos”. A métrica utilizada pelo cientista de dados é:
Considerando os conceitos de compensação viés-variância, sobreajuste, subajuste e técnicas de regularização, é correto afirmar que:
Assinale a alternativa INCORRETА.
Tabela 2. Análise de variância do experimento sem a informação dos Graus de Liberdade, utilizando um esquema fatorial 3x 5.
O valor do gasto mediano do grupo, em reais, foi de:
Um engenheiro monitora um processo de retífica de eixos com o Controle Estatístico de Processo. Um eixo produzido está dentro dos limites de especificação quando seu diâmetro está entre 49,98 mm e 50,02 mm. Os dados históricos indicam que o diâmetro dos eixos segue uma distribuição normal, com média de 50,00 mm e desvio padrão de 0,01 mm.
A porcentagem aproximada de eixos produzidos em que se espera obter um diâmetro dentro dos limites de especificação é