Questões de Concurso Público IPEA 2024 para Técnico de Planejamento e Pesquisa -Ciência de Dados
Foram encontradas 70 questões
Ano: 2024
Banca:
CESGRANRIO
Órgão:
IPEA
Prova:
CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa -Ciência de Dados |
Q2383218
Banco de Dados
O processo de ingestão de dados é normalmente dividido
em três etapas principais:
1 - Extração, ou coleta, de dados das fontes disponíveis;
2 - Transformação dos dados coletados para que atendam às necessidades específicas de processamento e análise; e
3 - Carga dos dados em algum repositório de destino, como um banco de dados relacional ou um data lake.
Essas três etapas podem variar dependendo de os dados serem estruturados ou não.
Nesse contexto, verifica-se que, na etapa de
1 - Extração, ou coleta, de dados das fontes disponíveis;
2 - Transformação dos dados coletados para que atendam às necessidades específicas de processamento e análise; e
3 - Carga dos dados em algum repositório de destino, como um banco de dados relacional ou um data lake.
Essas três etapas podem variar dependendo de os dados serem estruturados ou não.
Nesse contexto, verifica-se que, na etapa de
Ano: 2024
Banca:
CESGRANRIO
Órgão:
IPEA
Prova:
CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa -Ciência de Dados |
Q2383219
Sistemas Operacionais
No contexto da ciência de dados em cloud computing, e
considerando-se as soluções de Plataforma como Serviço
(PaaS), as de Infraestrutura como Serviço (IaaS) e as de
Software como Serviço (SaaS), constata-se que
Ano: 2024
Banca:
CESGRANRIO
Órgão:
IPEA
Prova:
CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa -Ciência de Dados |
Q2383220
Banco de Dados
O Ecossistema Spark tem componentes que oferecem
funcionalidades específicas que o tornam uma ferramenta
versátil e eficiente para o processamento de grandes
volumes de dados, a análise em tempo real, o aprendizado
de máquina e muito mais. Essa integração e flexibilidade
são algumas das razões pelas quais o Spark se tornou
uma ferramenta amplamente utilizada em aplicações
de Big Data. Os componentes da Plataforma Spark
pertencem a dois grupos principais: os componentes
básicos e os componentes especializados, que provêm
funcionalidades mais avançadas. Dentre os componentes
básicos, podemos destacar o Spark Core, também
conhecido como “coração” do Ecossistema, e que é
responsável pelas tarefas consideradas essenciais.
O componente Spark Core
O componente Spark Core
Ano: 2024
Banca:
CESGRANRIO
Órgão:
IPEA
Prova:
CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa -Ciência de Dados |
Q2383221
Banco de Dados
Existem várias abordagens para a ingestão de dados,
sendo cada uma delas adequada para determinado tipo
de necessidade e de cenário.
No caso da ingestão de dados em tempo real, streaming, os dados são
No caso da ingestão de dados em tempo real, streaming, os dados são
Ano: 2024
Banca:
CESGRANRIO
Órgão:
IPEA
Prova:
CESGRANRIO - 2024 - IPEA - Técnico de Planejamento e Pesquisa -Ciência de Dados |
Q2383222
Banco de Dados
Para melhorar o processamento de grandes volumes de
dados através de computação paralela ou distribuída,
pode-se utilizar sharding, técnica que divide os dados em
partes menores, chamadas shards. Essas partes são normalmente armazenadas em diferentes nós, ou sítios, de
processamento em um sistema distribuído.
O sharding é necessário para garantir a
O sharding é necessário para garantir a