Questões de Concurso
Sobre conhecimentos de estatística em estatística
Foram encontradas 1.223 questões
Frutas Cítricas: 40 amostras
Frutas Doces: 20 amostras
Frutas Oleaginosas: 20 amostras
Com base nessa distribuição, os valores do Índice de Gini e da Entropia, em bits, são dados, respectivamente, por:
I. Florestas aleatórias utilizam um conjunto de árvores de decisão para realizar tarefas de classificação ou regressão.
II. Uma vantagem da floresta aleatória é a alta precisão em comparação com um único modelo de árvore de decisão.
III. Florestas aleatórias não correm risco de super ajuste do modelo.
IV. O método k-means é diretamente relacionado à floresta aleatória.
Assinale a alternativa que apresenta APENAS as afirmações corretas.
Fonte: MARTINHO, Edson. DE SOUZA, Danilo Ferreira; MARTINHO, Meire Biudes; MORITA, Lia Hanna Martins; MAIONCHI, Daniela de Oliveira (Org.). ANUÁRIO ESTATÍSTICO DE ACIDENTES DE ORIGEM ELÉTRICA2025 – Ano base 2024. Salto-SP: Abracopel, 2025. [adaptado]
Considerando o contexto do Texto IV e as informações contidas no Mapa 1, assinale a alternativa CORRETA.
(__)Parâmetro é uma medida numérica que descreve uma característica de uma amostra, sendo utilizado para estimar o valor correspondente na população.
(__)Amostra é o conjunto de todos os elementos que possuem pelo menos uma característica em comum a ser estudada, sobre o qual se deseja fazer inferências.
(__)Censo é uma técnica especial usada para recolher amostras que garante o acaso na escolha, de modo a garantir o caráter de representatividade.
(__)População é um conjunto de elementos com pelo menos uma característica em comum, que deve delimitar inequivocamente quais os elementos pertencem a ela e quais não.
Após análise, assinale a alternativa que apresenta a sequência correta dos itens acima:
(__)Tanto a Análise Fatorial quanto a Análise de Componentes Principais são modelos matemáticos idênticos que buscam explicar a variância total das variáveis observadas, sendo os termos "fator" e "componente principal" sinônimos.
(__)Na Análise de Componentes Principais (ACP), os componentes são combinações lineares das variáveis originais e são assumidos como as causas latentes que geram as correlações entre essas variáveis.
(__)A Análise Fatorial é uma técnica mais indicada quando o objetivo é apenas a redução de dados para uso em análises subsequentes, sem a necessidade de uma interpretação teórica das dimensões subjacentes.
(__)Na Análise de Componentes Principais (ACP), os componentes principais são calculados de forma a serem ortogonais (não correlacionados) entre si, e o primeiro componente principal é a combinação linear das variáveis originais que captura a maior quantidade possível da variância total dos dados.
Após análise, assinale a alternativa que apresenta a sequência correta dos itens acima, de cima para baixo:
Considerando as melhores práticas e os desafios da mineração de dados, analise as afirmativas a seguir.
I. Foram gerados insights a partir de dados válidos e confiáveis.
II. A equipe executora contava com especialistas com experiência em programação Python, R e SQL.
III. A metodologia empregada atendeu a literatura e outros estudos técnicos semelhantes, descrevendo que foi selecionada apenas uma base de informações de dados não estruturados atualizada para realizar o processamento, em virtude de limitações de capacidade computacional, dos custos envolvidos e dos testes que demonstraram a introdução de incerteza ao se realizar uma coleta ampla e profunda de conjuntos de dados.
Está correto o que se afirma em:
A matriz a seguir apresenta dois valores desconhecidos, A e B, que podem ser determinados por diferentes métodos de interpolação geoestatística.

Com base nas informações apresentadas e considerando que a distância entre dois pontos adjacentes é igual a uma unidade, julgue o item subsequente.
Considerando a distribuição de frequência que trata da incidência de mortes por violência, assinale com V o que for verdadeiro e com F o que for falso.
( ) A idade média é de 9 anos.
( ) A distribuição é assimétrica.
( ) A idade mediana é de 10 anos.
( ) A incidência de casos com crianças com idade inferior a 8 anos foi de 32,50%.
( ) A melhor representação gráfica para essa distribuição de frequência é o gráfico em pizza.
Está correta, de cima para baixo, a seguinte sequência:
[35, 42, 38, 40, 1500, 37, 39, 41, 36, 2500, 43, 5000, 38, 44, 3700]
Utilizando o Spark SQL, calcularam a média e o desvio padrão amostral das compras. Um valor é considerado anomalia se estiver acima de 2 desvios padrão da média.
Em relação à situação proposta e à análise, assinale a alternativa que apresenta as transações que podem ser classificadas como anômalas.
O texto a seguir é referência para a questão.
Em uma aplicação de análise fatorial, baseada na matriz de covariâncias, p = 4 variáveis (y1, y2, y3 e y4) foram reduzidas a m = 2 fatores comuns (F1 e F2). Adicionalmente, considere a solução com m = 2 fatores, e as seguintes matrizes de cargas fatoriais (L) e matriz diagonal de variâncias específicas ψ:

em que Lij representa a carga da variável i no fator j, e ψij é a variância específica de yi, i, j = 1, 2, 3, 4.
Com base nessa situação e nos princípios dos métodos de multicritério, é CORRETO afirmar que: