Questões de Concurso Público CVM 2024 para Analista CVM - Perfil 7 - Ciência de Dados - Tarde

Foram encontradas 70 questões

Q2517658 Banco de Dados
As demandas de dados pelos analistas e cientistas de dados da CVM estão aumentando a cada dia. Para atendê-las com agilidade, é necessário obter dados de diversas fontes heterogêneas no seu formato original para posterior seleção e processamento sob demanda.

Para armazenar dados estruturados, não estruturados e semiestruturados, deve-se implementar um(a):
Alternativas
Q2517659 Programação
Uma das principais atividades de implementação de um ambiente analítico é a limpeza dos conjuntos de dados origem. A biblioteca Pandas do Python é utilizada para analisar e também para limpar conjuntos de dados. Observe o trecho de código Python a seguir, que utiliza a biblioteca Pandas.

import pandas as pd df = pd.read_csv('data.csv') df.dropna(inplace = True)

O resultado da execução do código apresentado é a alteração do conjunto original de dados com o(a):
Alternativas
Q2517660 Programação
Durante a preparação de dados para análise, alterar a quantidade de dimensões e/ou elementos de cada dimensão de um dado do tipo Array é uma operação importante na manipulação de dados. Observe o seguinte trecho de código escrito na linguagem de programação Python:

import numpy as np arr = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12]) newarr = arr.reshape(2, 3, 2) print(newarr)

O resultado da execução do código apresentado é:
Alternativas
Q2517661 Banco de Dados

Observe o script SQL a seguir.


Imagem associada para resolução da questão



Para analisar quais auditores estão realizando auditoria em quais auditados, é necessária a execução de uma consulta SQL que apresente o seguinte resultado:



Imagem associada para resolução da questão


Para obter o resultado apresentado, deve-se executar a consulta SQL:

Alternativas
Q2517662 Banco de Dados

Observe o script SQL a seguir.


Imagem associada para resolução da questão



O resultado JSON da execução do script apresentado é:

Alternativas
Q2517663 Estatística
O desempenho de uma variável econômica em 2023, em termos das variações percentuais trimestrais, foi armazenado no vetor (2, −1, 4, −2) ′ . Com o intuito de avaliar a variabilidade nesse ano, foram consideradas as quatro métricas a seguir.

1. norma L1 das componentes do vetor;
2. norma L2 das componentes do vetor;
3. soma dos valores absolutos (módulos) dos desvios de cada componente do vetor em relação à mediana de todos;
4. raiz quadrada da soma dos quadrados dos desvios em relação à sua média, isto é, o numerador do desvio padrão.

A respeito da comparação entre os valores assumidos por essas medidas, a única afirmativa correta é:
Alternativas
Q2517664 Estatística
Um analista estuda discrepâncias salariais entre os seguintes setores: manufatura, serviços financeiros e tecnologia. A figura a seguir apresenta os box-plots dos salários desses setores, em reais.


Imagem associada para resolução da questão


Dentre as afirmativas a seguir, a única correta é:
Alternativas
Q2517665 Estatística
Suponha que sejam usados indicadores para avaliar a possibilidade de inadimplência de títulos emitidos no mercado, e seja X um desses indicadores. Se X assume um valor inferior a 4, a probabilidade de que o emissor do título venha a se tornar inadimplente é de apenas 0,2. Por outro lado, se X estiver acima de 7, a probabilidade de inadimplência é de 0,6. Finalmente, se o indicador estiver situado entre 4 e 7 (incluindo os extremos), o título emitido possui probabilidade de inadimplência igual a 0,4. Quando se considera o universo de todos os títulos emitidos neste mercado, os valores de X seguem distribuição Normal com média 6 e variância 4.

Dado que o emissor de um determinado título se tornou inadimplente, a probabilidade de que o valor de X associado a ele estivesse situado entre 4 e 7 é:
Alternativas
Q2517666 Estatística
Em um concurso, 2.048 candidatos prestam um exame em que são submetidos a 6 questões de múltipla escolha, cada uma com 4 alternativas, das quais apenas uma é correta. Um candidato passa para a segunda fase do concurso caso acerte, pelo menos, 4 questões.

Se todos os candidatos “chutam” as respostas, isto é, sempre escolhem ao acaso uma alternativa, o valor esperado do número de aprovados para a segunda fase é:
Alternativas
Q2517667 Estatística
Suponha que o tempo T até um que investidor solicite o resgate integral de um fundo, em meses, seja representado por uma variável aleatória contínua com função de densidade

f(t) = 0,05e −0.05t ,t > 0.

De acordo com esse modelo probabilístico, o período até que a metade dos investidores desse fundo venha a solicitar o resgate integral é de, aproximadamente:
Alternativas
Q2517668 Estatística
Uma agência reguladora recebe, em média, uma denúncia a cada 15 minutos.

Se o número de denúncias em um período qualquer segue distribuição de Poisson, a probabilidade de que, no intervalo de 1 hora, cheguem pelo menos 2 denúncias, sabendo-se que pelo menos uma denúncia terá chegado, é de:
Alternativas
Q2517669 Estatística
A proporção de emissões de títulos imobiliários com suspeita de irregularidade em um ano pode ser representada por uma variável aleatória contínua X com função de densidade:

f(x) = (θ+1)xθ , 0<x<1

Deseja-se conduzir uma análise probabilística dessa proporção em 2024; porém, para isso, é preciso estimar o parâmetro θ . Nos últimos 5 anos, a proporção anual registrada foi: 0,3; 0,2; 0,6; 0,7 e 0,2.

Considerando que esses registros sejam observações de uma amostra aleatória simples da população referenciada por f(x), a estimativa do parâmetro θ a partir dessa amostra, obtida pelo método dos momentos, é:  
Alternativas
Q2517670 Estatística
Suponha que o tempo X, em dias, até que uma debênture incentivada aumente seu valor de mercado em 30%, seja uma variável aleatória com função de densidade

f(x) = θ2 xe −θx ; x > 0.

O tempo médio registrado, com base nas observações de uma amostra aleatória simples, foi de 400 dias.
Com base nessa amostra, a estimativa de máxima verossimilhança do parâmetro θ é:
Alternativas
Q2517671 Estatística
Um indicador de desempenho das instituições que atuam no mercado financeiro brasileiro é avaliado com base nas 8 observações de uma amostra aleatória simples, considerando 8 dessas instituições. O desvio padrão amostral do indicador foi igual a 8.

Supondo que a distribuição dos valores do indicador no universo em estudo seja Normal, o limite inferior do intervalo de confiança de 95% para a variância populacional é, aproximadamente (considere probabilidades iguais nas caudas): 
Alternativas
Q2517672 Estatística
Um analista busca evidenciar estatisticamente a conjectura de que a valorização média das cotas dos fundos imobiliários negociados no mercado em 2023 tenha sido superior a 15%. Supõe-se que as valorizações das cotas sigam distribuição Normal, sendo o desvio padrão desconhecido. Com base nas observações de uma amostra aleatória de tamanho 16, ele observa que a valorização média foi de 15,85%, com desvio padrão amostral igual a 2%.

Considerando os três níveis de significância usuais (0,01, 0,05 e 0,1), a conjectura investigada:
Alternativas
Q2517673 Estatística
O número de fraudes anuais detectadas no mercado financeiro, nos últimos 16 anos, foi registrado por um auditor. Ele deseja testar se o resultado fornece evidência de que a média anual de fraudes no mercado é inferior a 4, supondo que esses 16 registros constituam observações de uma amostra aleatória simples obtida a partir de uma população Normal. A variância dessa população é conhecida e igual a 25.

Nessas condições, o auditor obterá evidência estatística de que a média populacional é inferior a 4, ao nível de significância 0,1, se a média na amostra for menor ou igual a:
Alternativas
Q2517674 Estatística
Um analista investiga, mediante um modelo de regressão linear clássico, a relação entre a rentabilidade y de ofertas públicas disponíveis no mercado e um indicador de risco associado ao emissor, representado pela variável explicativa x. Considera-se que o termo de erro do modelo siga distribuição Normal. Foi utilizada uma amostra aleatória simples de 20 pares (x,y) de observações mensais. O modelo estimado está apresentado a seguir (erros padrão entre parênteses).

Imagem associada para resolução da questão


O intervalo de 95% de confiança associado ao impacto de x sobre y é (considere apenas 3 casas decimais):
Alternativas
Q2517675 Estatística
Um gestor avalia a expectativa de rentabilidade mensal de um fundo de ações utilizando o modelo de regressão linear clássico y = β0 + β1x + ϵ, em que y é a rentabilidade, x é um indicador econômico, β0 e β1 são parâmetros a serem estimados por mínimos quadrados e ϵ é o termo de erro. O modelo satisfaz aos pressupostos para estimação por mínimos quadrados. Com base em uma amostra de 3 meses, na qual os valores observados da variável explicativa x foram x1 = 1, x2 = 2 e x3 = 2, o modelo estimado conduziu aos resíduos e1 = 2, e2 = 1 e e3 = 1.

A estimativa, baseada no estimador não viciado, para a covariância entre os estimadores de β0 e β1, é:
Alternativas
Q2517676 Estatística
Um analista financeiro tenta prever a rentabilidade anual futura de um ativo, em termos reais. Ele considera que a rentabilidade real (em %) siga, ao longo dos anos, um modelo AR(1): yt = Φ0Φ1 yt-1εt, em que t é o ano, E(εt) = 0 e corr(εtεt-s) = 0, para s = 1, 2, ... . Sabe-se que a rentabilidade real prevista pelo modelo para o longuíssimo prazo foi de 4% ao ano.
Se a estimativa obtida para o parâmetro Φ1 foi 0,8, a estimativa do parâmetro Φ0 foi:
Alternativas
Q2517677 Estatística
Considere duas séries temporais x e y, ambas integradas de ordem 1, ou I(1), representando a evolução de agregados macroeconômicos no tempo. Ao aplicarmos o teste de raiz unitária ADF aos resíduos da regressão linear de y em x (com valores críticos propostos por Engle-Granger para aplicá-lo a resíduos de uma regressão), verifica-se que a hipótese nula não é rejeitada, aos níveis usuais.
É correto concluir que essas séries:
(Obs: os valores críticos propostos por Engle-Granger para esse tipo de teste não são necessários para a resolução da questão) 
Alternativas
Respostas
41: B
42: D
43: C
44: C
45: A
46: D
47: D
48: D
49: A
50: C
51: E
52: B
53: D
54: D
55: D
56: C
57: B
58: D
59: E
60: E