Questões de Concurso
Sobre big data em banco de dados
Foram encontradas 379 questões
Assinale a opção que apresenta, respectivamente, uma ferramenta que trata do modelo de dados orientado a colunas e outra, do modelo orientado a documentos.
Sobre os 5Vs que caracterizam o Big Data, assinale a afirmativa correta.
Esses modelos são classificados de acordo com a estrutura em que os dados são armazenados.
Um deles, especificamente, não considera conceitos como normalização de dados, criação de joins e definição de esquemas rígidos. Ele armazena estruturas flexíveis que podem ser obtidas por meio de dados semiestruturados, como os formatos XML e JSON. Cada uma dessas estruturas armazenadas não contém necessariamente os mesmos atributos, pois não é necessário definir um esquema.
O modelo em questão é o
No que se refere à ciência de dados, julgue o item seguinte.
Em big data, representações visuais, como gráficos e dashboards, permitem que padrões sejam rapidamente identificados.
Acerca da arquitetura de sistemas analíticos e do ecossistema Apache Hadoop, julgue o próximo item.
O Hadoop é considerado ineficiente em cenários que exigem escalabilidade horizontal, sendo mais adequado para processamento em clusters pequenos.
A respeito de Big Data, julgue o item a seguir.
O armazenamento de Big Data em sistemas distribuídos, a exemplo do HDFS (Hadoop Distributed File System), melhora a tolerância a falhas e a escalabilidade ao distribuir dados entre múltiplos nós.
A respeito de Big Data, julgue o item a seguir.
Na etapa de ingestão de um pipeline de dados de Big Data, os dados de diversas fontes são coletados e transportados para um armazenamento centralizado.
A respeito de Big Data, julgue o item a seguir.
Os data lakes, por armazenarem dados em seus formatos originais, eliminam completamente a necessidade de data warehouses em ambientes de Big Data.
A respeito de inteligência artificial, de tipos de análise de dados e de Big Data, julgue o item que se segue.
A veracidade em Big Data reflete o desafio de se assegurar a qualidade e precisão de dados frequentemente confusos, ruidosos e propensos a erros que comprometem sua confiabilidade.
A respeito dessas soluções, assinale a afirmativa correta.
Julgue o seguinte item, a respeito de big data.
Variabilidade em Big Data é a capacidade de lidar diferentes tipos de dados, como imagens, textos e vídeos, provenientes de múltiplas fontes, sejam estruturados ou não estruturados.
I – O Hadoop Distributed File System (HDFS) é um sistema de arquivos distribuídos otimizado para dados não estruturados.
II – Os Bancos de Dados NoSQL podem tratar grandes volumes de dados estruturados, semiestruturados e não estruturados.
III – O paradigma de programação MapReduce divide o trabalho em tarefas de mapeamento e redução para manipulação de dados distribuídos.
As afirmativas I, II e III são, respectivamente:
Em relação ao tema, relacione os conceitos a seguir às suas respectivas aplicações.
1. Volume.
2. Variedade.
3. Velocidade.
4. Veracidade.
( ) Os sistemas gerenciadores de bancos de dados relacionais foram projetados e otimizados para funcionar em dados estruturados. Em aplicações de Big Data isto não é mandatório, os demais tipos de dados também têm de ser geridos e processados. Além dos estruturados, os dados podem incluir imagens, texto, áudio e vídeo. Aproximadamente 90% dos dados gerados atualmente são não estruturados. Os sistemas de Big Data precisam ser capazes de gerenciar e processar todos esses tipos de dados perfeitamente.
( ) Os dados usados em aplicações de Big Data vêm de muitas fontes, cada uma pode ter estruturas distintas e não ser totalmente confiáveis, podem haver erros, ruídos, inconsistências, desinformações deliberadas entre outros. São comumente referidos como “dados sujos”, alega-se que dados sujos custam bilhões dólares por ano e os sistemas de Big Data precisam “limpar” os dados e manter sua proveniência para justificar sua confiabilidade.
( ) Os conjuntos de dados usados nas aplicações de Big Data são massivos, normalmente na faixa de petabytes, com o rápido crescimento da Internet as aplicações em breve atingirão zettabytes. Para colocar isso em perspectiva, em 2016, o Google informou que os uploads de usuários para o YouTube exigiram 1 petabytes de nova capacidade de armazenamento por dia. Em 2018, o Facebook armazenava cerca de 250 bilhões de imagens exigindo exabytes de armazenamento.
( ) Um aspecto importante das aplicações de Big Data é que elas precisam lidar com dados que chegam ao sistema sob a forma fluxos em tempo real, exigindo que sejam capazes de processar os dados à medida que eles chegam. O Facebook processa mais de 900 milhões de fotos que os usuários carregam por dia. O Alibaba informou que durante um recente período de pico tiveram que processar 470 milhões registros de eventos por segundo. Sistemas desse tipo não permitem que os dados sejam armazenados antes do processamento.
A relação correta, na ordem apresentada, é:
Esse conceito é conhecido como
Em uma arquitetura de Big Data, a camada de processamento