Questões de Concurso
Sobre estatística para fgv
Foram encontradas 1.519 questões
Resolva questões gratuitamente!
Junte-se a mais de 4 milhões de concurseiros!
Ŷ = 100 − 0, 25x
Matheus certificou-se que o modelo atende a todas as premissas do modelo de regressão linear. As pontuações esperadas para dois alunos que dedicaram 300 horas e 50 horas ao uso de LLMs no último semestre são, respectivamente,
Considerando os seguintes erros posicionais (em metros) obtidos para 4 interseções:
• Cruzamento 1: 1,0 m
• Cruzamento 2: 2,0 m
• Cruzamento 3: 1,0 m
• Cruzamento 4: 2,0 m
Considerando √2 = 1,4, √3 = 1,7 e √5 = 2,2, o valor do RMSEr é aproximadamente
• média: 12 minutos; • mediana: 10 minutos; • desvio padrão: 6 minutos; • mínimo: 3 minutos; • máximo: 32 minutos.
Os analistas estão considerando realizar uma mudança no processo de atendimento, inserindo uma etapa prévia que aumentaria o tempo de cada atendimento em 20%.
Considerando os princípios da inferência estatística e da interpretação de medidas de posição e dispersão, se implementada, a mudança no processo de atendimento:
Com base nesses dados, e sabendo que a distribuição das diferenças de avaliação entre os critérios (A – B) pode ser considerada aproximadamente normal, o erro padrão da média das diferenças é igual a:
Três diferentes amostras aleatórias simples foram selecionadas com o objetivo de estimar a média de deslocamento da população:
• amostra 1: 25 pessoas • amostra 2: 100 pessoas • amostra 3: 400 pessoas
Considerando que o objetivo é estimar se a probabilidade de que a média amostral difira da média populacional por, no máximo, 2 minutos (ou seja, esteja no intervalo entre 58 e 62 minutos), os analistas devem considerar que:
Com base nessa exigência, o tamanho mínimo da amostra para garantir esse nível de precisão deve ser de:
Em relação às variâncias dos estimadores obtidos pelas duas análises, é correto afirmar que:
Para apresentar a quantidade de atendimentos, Aldo deve implementar uma variável do tipo:
Como a pesquisa ainda não tem uma variável-alvo definida, o objetivo inicial é identificar grupos latentes de usuários com padrões semelhantes de comportamento, considerando variáveis como frequência de participação, região e faixa etária. Após essa etapa, a equipe pretende avaliar os fatores que contribuem para o engajamento cultural em regiões com baixa participação e, por fim, recomendar estratégias de ampliação de acesso.
Considerando os modelos multivariados, a natureza da base de dados e os objetivos e etapas propostos para a pesquisa, a equipe responsável deveria:
A média da nota de satisfação foi de 7,2 (em uma escala de 0 a 10), e a variância populacional previamente estimada é de 1,44. A equipe deseja construir um intervalo de confiança de 95% para estimar a média da população com base na amostra. Utilize a tabela abaixo com valores da curva normal padrão (Z):
Com base nesses dados, o intervalo de confiança de 95% para a média populacional é, aproximadamente:
O desempenho é considerado satisfatório quando até 5% das metas pactuadas não são cumpridas. Em contrapartida, é considerado insatisfatório quando 20% ou mais das metas pactuadas não são cumpridas.
Os dados prévios são limitados, e a equipe deseja garantir decisões estatisticamente robustas — especialmente quanto à aceitação ou rejeição de municípios com base nos indicadores reportados. Para definir o tamanho da amostra e a regra de decisão sobre o desempenho dos municípios, a equipe técnica estabeleceu os seguintes critérios:
• a margem de erro máxima permitida para estimar a proporção populacional de municípios com desempenho satisfatório é de 4%;
• o nível de confiança deve ser de 95%;
• os erros do tipo I e II devem ser controlados de modo que:
▪ municípios com desempenho considerado bom sejam rejeitados erroneamente em, no máximo, 5% dos casos;
▪ municípios com desempenho considerado ruim sejam aceitos erroneamente em, no máximo, 10% dos casos.
Com base nessas informações, uma interpretação adequada dos parâmetros definidos pela equipe é a de que:
Agora, esses analistas desejam utilizar os dados consolidados para testar a seguinte hipótese: mulheres com mais tempo de permanência no programa apresentam maior renda mensal. Abaixo está uma amostra da base de dados consolidada, em que cada linha corresponde a um respondente:
Para viabilizar a realização de testes estatísticos válidos a partir da base de dados acima e responder à pergunta de pesquisa, na etapa do tratamento dos dados, os analistas devem:
Se quatro desses eleitores foram aleatoriamente sorteados (com reposição), a probabilidade de que exatamente dois tenham votado em C (e dois não tenham nele votado) é aproximadamente igual a:
Observe a amostra de dados contábeis (em milhares de reais) a seguir.
132 202 185 214 240 186 183 180 203 204 138 98 194 295 103 222 104
A mediana desse conjunto de dados, em milhares de reais, é igual a:
Considerando as melhores práticas e os desafios da mineração de dados, analise as afirmativas a seguir.
I. Foram gerados insights a partir de dados válidos e confiáveis.
II. A equipe executora contava com especialistas com experiência em programação Python, R e SQL.
III. A metodologia empregada atendeu a literatura e outros estudos técnicos semelhantes, descrevendo que foi selecionada apenas uma base de informações de dados não estruturados atualizada para realizar o processamento, em virtude de limitações de capacidade computacional, dos custos envolvidos e dos testes que demonstraram a introdução de incerteza ao se realizar uma coleta ampla e profunda de conjuntos de dados.
Está correto o que se afirma em:
Dado que o 97,5 percentil da distribuição normal padrão é igual a 1,96, um intervalo de 95% de confiança para μ será dado aproximadamente por:
Daqui a 8 anos, os novos valores da média, da mediana e do desvio padrão das idades desse mesmo grupo de pessoas serão, respectivamente, iguais a:
( ) A detecção de valor discrepante corresponde à identificação de uma observação, evento ou ponto de dados que representa um espaço vetorial multidimensional convexo e fixo, tornando-o inconsistente em relação ao resto do conjunto de dados.
( ) O aprendizado de máquina e a inteligência artificial são empregados para identificar automaticamente alterações inesperadas no comportamento normal de um conjunto de dados.
( ) As anomalias costumam ser raras e as características do comportamento normal podem ser complexas e dinâmicas, o que torna a detecção desafiadora.
As afirmativas são, respectivamente,
O desvio padrão, em milhões, do faturamento da empresa, ao longo do ano, é