Questões de Concurso
Comentadas para cesgranrio
Foram encontradas 27.574 questões
Resolva questões gratuitamente!
Junte-se a mais de 4 milhões de concurseiros!

Um analista de dados resolveu verificar se há presença de outliers nesse conjunto de índices e decidiu fazer isso por meio de um Box Plot dos dados fornecidos.
Com base na técnica escolhida pelo analista, quantos índices podem ser enquadrados como outliers?
Considere o extrato da Tabela a seguir.

Qual o valor-p do teste aplicado pelo pesquisador?
Previsão para a bolsa é de alta em 2023
Casa mais otimista projeta Ibovespa em 150 mil pontos; rumo dos juros será decisivo

Disponível em: https://valor.globo.com/financas/noticia/2022/12/22/previsao-para-a-bolsa-e-de-alta-em-20233.ghtml. Acesso em: 29 dez. 2023. Adaptado.
No útimo pregão do ano de 2023, o Ibovespa fechou em 134.185,23 pontos, conforme dados da B3.
Considerando-se os dados apresentados, a medida de posição das estimativas das instituições financeiras que mais se aproximou do resultado real, apresentado pelo Ibovespa no último pregão do ano, foi a:
Quase 5% das crianças e adolescentes do país estão em situação de trabalho infantil, aponta IBGE
O Brasil tem um total de 38,365 milhões de pessoas com idade de 5 a 17 anos. Destas, 2,103 milhões realizam atividades econômicas ou de autoconsumo, estando 1,881 milhão em situação de trabalho infantil, o equivalente a 4,9% do total de pessoas entre 5 e 17 anos no país, segundo dados da Pesquisa Nacional por Amostra de Domicílios Contínua 2022, divulgados pelo Instituto Brasileiro de Geografia e Estatística (IBGE). A pesquisa também apontou que, em 2022, 756 mil crianças e adolescentes exerciam atividades da Lista TIP, do governo federal, que elenca as piores formas de trabalho infantil no país. No geral, são serviços que envolvem risco de acidentes ou são prejudiciais à saúde, como trabalho na construção civil, em matadouros, oficinas mecânicas, comércio ambulante em locais públicos, coleta de lixo, venda de bebidas alcoólicas, entre outras atividades.

A pesquisa do IBGE considera duas categorias de atividades:
• econômica, que é a de quem trabalhou pelo menos 1 hora completa e foi remunerado em dinheiro, produtos, benefícios, etc., ou que não teve remuneração direta, mas atuou para ajudar a atividade econômica de algum parente.
• de autoconsumo, que incluem pesca, criação de animais, fabricação de roupas, construção de imóveis e outras que sejam para uso exclusivo da pessoa ou de parentes.
E nem todas as pessoas de 5 a 17 anos que exercem essas atividades se enquadram na situação de trabalho infantil.
Disponível em: https://g1.globo.com/trabalho-e-carreira/noticia/2023/12/20/quase-5percent-das-criancas-e-adolescentes-do-pais-estao-emsituacao-de-trabalho-infantil-aponta-ibge.ghtml. Acesso em: 29 dez 2023. Adaptado.
Nesse contexto, considere que uma pessoa de 5 a 17 anos é escolhida ao acaso e que se deseja estimar a probabilidade de que essa pessoa exerça trabalho infantil, mas não em uma de suas piores formas, que são elencadas na lista TIP, dado que ela realiza atividades econômicas ou de autoconsumo.
Essa probabilidade é, aproximadamente, de
Nesse contexto, considere duas listas, L1 e L2, que foram implementadas em Python. As configurações iniciais dessas listas são as seguintes:
L1 = [1, 2, 3]
L2 = [3, 4, 5]
Em seguida, foram feitas as seguintes operações:
L1.append(3)
L3 = L1
L3.append(7)
L1.append(8)
L4 = L1 + L2
Qual é o valor de L4?
A principal propriedade que caracteriza uma função pura é a(o)
A linha de código em R que calcula corretamente a média do vetor dados é
Para selecionar aleatoriamente 20% das linhas do DataFrame e apenas as colunas Peso e Pressão Arterial, pode ser usada a expressão
Qual função ou conjunto de funções do R ele deve usar para realizar essa tarefa de forma eficiente?
Uma forma correta de criar um gráfico XY básico, apenas com pontos, passando esses vetores como parâmetros é
O principal motivador para paralelizar uma rotina é
print("%.1f" % 12.45667)
Outra forma correta de, em Python, imprimir o número 12.45667 exatamente como 12.5 é
No tratamento desses dados, o processo de enriquecimento consiste em
Como viabilizar o compartilhamento efetivo de dados e informações das cadeias agropecuárias entre instituições de governo e dessas com a sociedade? Esta foi a principal questão que os participantes do 1º Painel de Cadeias Agropecuárias e Dados Abertos buscaram responder na tarde de quinta-feira (2/12), durante webinar realizado pelo Instituto de Pesquisa Econômica Aplicada (Ipea).
Disponível em: https://www.ipea.gov.br/portal/categorias/45-todas-as-noticias/noticias/11394-especialistas-debatem-abertura- -e-integracao-de-dados-de-cadeias-agropecuarias?highlight= WyJhYmFzdGVjaW1lbnRvIiwiYWd1YSIsIidcdTAwZTFndWEiLCJhZ3VhJywiXQ==. Acesso em: 5 jan. 2024.
Considerando-se o questionamento apresentado no texto e sabendo-se que, quando da integração de conjuntos de dados de múltiplas fontes, matching é uma questão relevante, o problema de identificação de entidades em múltiplas fontes de dados remete ao desafio de
Em preparação para análise de um conjunto de dados, o tratamento de outliers
Considerando-se a necessidade de manter a precisão e a confiabilidade do estudo, qual das seguintes abordagens seria a mais apropriada para tratar esses dados ausentes sobre o peso dos participantes?
Qual das seguintes técnicas de normalização numérica é mais adequada para esse conjunto de dados?
A deduplicação de dados é útil, por exemplo, no domínio da medicina, em que há grandes conjuntos de dados genômicos que são analisados para identificar padrões e mutações associadas a doenças específicas. Nesse cenário, a deduplicação é vital para assegurar a precisão das análises, pois, se amostras de DNA de um mesmo paciente são coletadas e sequenciadas em diferentes momentos e locais, pode haver uma repetição inadvertida dessas amostras no banco de dados. Nesse contexto, a deduplicação de dados é crucial para a integridade da pesquisa, pois dados duplicados podem levar a interpretações errôneas, como a superestimação da prevalência de uma mutação genética rara.
A técnica de deduplicação de dados consiste em um processo de
Qual técnica de desidentificação de dados sensíveis é a mais adequada para preservar a privacidade dos indivíduos processados, permitindo, ainda, a análise sociodemográfica dos bairros?
Qual das palavras a seguir apresenta o maior valor da similaridade de Jaccard, quando comparada com a palavra “computador”?