Questões de Concurso
Sobre big data em banco de dados
Foram encontradas 379 questões
I. Sistemas de simulação é o uso de um sistema integrado, baseado em computador, que consiste em simulação, visualização 3D, análises e ferramentas de colaboração para criar definições de processos de manufatura e produto simultaneamente.
II. A interconexão entre objetos por meio de infraestrutura habilitadora (eletrônica, software, sensores e/ou atuadores), com capacidade de computação distribuída e organizados em redes, que passam a se comunicar e interagir, podendo ser remotamente monitorados e/ou controlados, resultando em ganhos de eficiência, caracteriza o conceito de Cloud Computing.
III. Big Data consiste no uso de tecnologias digitais para transformar processos de produção, de desenvolvimento de produtos e/ou modelos de negócios, visando à otimização e à eficiência nos processos. A transformação digital abrange: projeto e implementação de plano de digitalização, sensoriamento, aquisição e tratamento de dados.
Data lake é um repositório onde os dados podem ser armazenados em vários formatos, incluindo-se registros estruturados e formatos de arquivo não estruturados.
No que se refere a noções de Big Data, julgue o item subsequente.
Dados estruturados e semiestruturados são tipos de Big Data,
enquanto os dados não estruturados não se enquadram nos
requisitos para Big Data.
No que se refere a noções de Big Data, julgue o item subsequente.
Os bancos de dados de Big Data ingerem, preparam e
armazenam rapidamente grandes quantidades de dados
diversos em um formato que as ferramentas analíticas
possam usar.
1. Valor
2. Volume
3. Variedade
4. Velocidade
5. Veracidade
6. Validade
Assinale a alternativa que indica todas as afirmativas corretas.
Para isso, a característica de banco de dados massivos (Big Data) sobre os tipos de dados e heterogeneidade das fontes de dados que Jair deve considerar é:
Uma das principais características de um banco de dados Big Data é:
Spark é uma arquitetura de sistema operacional para trabalhar com dados organizados de forma hierárquica, utilizando-se o módulo Spark SQL, que permite consultar arquivos pelo seu conteúdo.
Julgue o item a seguir, relativos ao Hadoop e ao Spark.
Hadoop é uma plataforma de código aberto que oferece uma
solução tecnológica confiável e escalável para
armazenamento e análise de grande quantidade de dados.
Um sistema de aprendizado não supervisionado, dotado de um conjunto de dados de treinamento que foram classificados manualmente, tenta aprender, a partir desses dados de treinamento, uma forma de classificá-los, bem como de classificar novos dados, ainda não observados.
Um gráfico muito útil para a etapa de análise de dados é o box plot, que ajuda a identificar a distribuição real ou padrão dos valores dos dados, permite visualizar mediana, quartis, valores mínimos e máximos, além de identificar possíveis outliers.
Nas aplicações Big Data, a arquitetura paralela e distribuída (Cluster) é o meio para a criação de soluções capazes de analisar grandes bases de dados, processar seus pesados cálculos e disponibilizar serviços especializados para os mais diversos cenários.
Acerca de Big Data, business intelligence e machine learning julgue o item a seguir.
Big Data se refere a grandes e complexos conjuntos de
dados, que podem estar alocados em múltiplos servidores, e
não necessariamente esses dados precisam estar estruturados.
Acerca de Big Data, business intelligence e machine learning julgue o item a seguir.
O Hadoop MapReduce possui diversas bibliotecas para
manipulação e serialização de arquivos e pode ser utilizado
para disponibilizar integrações de interface para outros
sistemas.
As ferramentas utilizadas para manipular dados em Big Data são as mesmas utilizadas em bancos de dados relacionais.