Questões de Concurso Comentadas sobre big data em banco de dados

Foram encontradas 341 questões

Q3251998 Banco de Dados
Qual alternativa é uma plataforma de código aberto que permite coletar, processar e armazenar dados em tempo real, que não possui suporte nativo de Machine Learning? Ela é usada para lidar com grandes volumes de dados de streaming, que são gerados continuamente por diversas fontes. 
Alternativas
Q3251996 Banco de Dados
Que tipo de análise utiliza Big Data para prever comportamentos futuros com base em padrões históricos e tendências, ajudando as organizações a tomar decisões mais informadas e de forma mais assertiva. todavia, sem gerar recomendações de ações ou soluções automaticamente? 
Alternativas
Q3251974 Banco de Dados
Big data é uma colação de dados oriundas de várias fontes e em grande quantidade. Geralmente big data é descrito através de cinco características conhecidas como 5 Vs, sendo elas: 
Alternativas
Q3221384 Banco de Dados
Big Data é tipicamente definida por três V’s: Quais são os V’s do Big Data?
Alternativas
Q3208439 Banco de Dados

A respeito de transformação digital, julgue o item a seguir.


As políticas públicas para a transformação digital dirigem-se preferencialmente a empresas de médio e grande porte, em razão de sua maior capacidade de investimento. 

Alternativas
Q3208416 Banco de Dados

Em relação a manipulação e limpeza de dados, julgue o item a seguir. 


A transformação de dados categóricos utilizando codificação one-hot sempre reduz a dimensionalidade do conjunto de dados. 

Alternativas
Q3208415 Banco de Dados

Em relação a manipulação e limpeza de dados, julgue o item a seguir. 


A normalização dos dados é importante na preparação de dados para modelos de aprendizado de máquina, pois garante que todas as variáveis estejam na mesma escala, independentemente de sua importância no modelo. 

Alternativas
Q3208414 Banco de Dados

Em relação a manipulação e limpeza de dados, julgue o item a seguir. 


Local outlier factor é uma técnica de detecção de outliers que mede a anomalia de um dado com base na densidade local dos seus vizinhos. 

Alternativas
Q3208409 Banco de Dados

Julgue o próximo item, a respeito de machine leaning


Árvores de decisão são técnicas de modelagem preditiva que particionam iterativamente os dados em subconjuntos homogêneos baseados em variáveis explicativas.

Alternativas
Q3208408 Banco de Dados

Julgue o próximo item, a respeito de machine leaning


Os algoritmos de regressão linear, por minimizarem a soma dos resíduos quadrados para ajustar os coeficientes, são sensíveis a outliers, que podem distorcer os coeficientes e comprometer a previsão do modelo. 

Alternativas
Q3208407 Banco de Dados

Julgue o próximo item, a respeito de machine leaning


Grandes volumes de dados frequentemente revelam padrões e tendências que são valiosos para análises preditivas e tomadas de decisão, facilitando a antecipação de comportamentos futuros e permitindo melhor alocação de recursos e planejamento. 

Alternativas
Q3188247 Banco de Dados
Inicialmente, o conceito de Big Data era amplamente descrito pelos chamados ‘3 Vs’. Com o avanço da área, novos ‘Vs’ foram incorporados para ampliar essa definição. Um desses novos ‘Vs’ é a veracidade.
Assinale a opção que melhor define o conceito de veracidade. 
Alternativas
Q3185290 Banco de Dados
No contexto de análises estatísticas, os dados podem estar disponíveis em diferentes tipos de organização. Dependendo da forma de definição e armazenamento, os conjuntos de dados são tipicamente caracterizados como estruturados, semiestruturados e não estruturados. Diante do exposto, analise as afirmativas a seguir.

I. Enquanto dados não estruturados são normalmente armazenados em seu formato nativo (como vídeos, imagens ou documentos de texto), dados estruturados são armazenados em linhas e colunas e podem ser mapeados para campos predefinidos.
II. Ao contrário dos dados estruturados, que podem ser organizados e acessados por meio de bancos de dados relacionais, dados não estruturados não têm um modelo rígido de organização predefinido.
III. Conjuntos de dados semiestruturados usam tags e marcadores (ou seja, metadados) em vez de exigir um esquema predefinido em tabelas, linhas e colunas, como nos dados estruturados.
IV. Os data lakes podem ser projetados para armazenar dados semiestruturados juntamente com dados estruturados, permitindo a coexistência de dados de ambos os tipos.

Está correto o que se afirma em
Alternativas
Q3178710 Banco de Dados
O pré-processamento de dados é uma etapa essencial para garantir a qualidade e a eficiência das análises em ambientes de Big Data. Sendo assim, assinale a alternativa que descreve corretamente uma técnica comum de pré-processamento de dados.
Alternativas
Q3174803 Banco de Dados
No contexto de ferramentas de integração de ambientes de Big Data e Banco de Dados relacionais, associe cada descrição a seguir à respectiva ferramenta.
1. Apache Kafka. 2. Apache Sqoop.
( ) Muito usado para transferência de dados entre bancos relacionais para o ecossistema Hadoop.
( ) Suas transferências de dados são baseadas em lotes, focando em transferências programadas ou sob demanda.
( ) Muito usado para streaming de dados em tempo real.
( ) Trabalha com mensageria distribuída, baseada no conceito de tópicos, permite que produtores enviem mensagens e consumidores as processem de forma assíncrona.

A associação correta, na ordem apresentada, é
Alternativas
Q3174801 Banco de Dados
No contexto de Big Data, novas ferramentas e novos modelos de armazenamento de dados foram criados para atender às necessidades de flexibilidade, disponibilidade, escalabilidade e desempenho das aplicações, muitas vezes sacrificando uma ou mais propriedades ACID.
Assinale a opção que apresenta, respectivamente, uma ferramenta que trata do modelo de dados orientado a colunas e outra, do modelo orientado a documentos.
Alternativas
Q3174800 Banco de Dados
As organizações públicas podem se beneficiar do uso de Big Data para auditar grandes volumes de informações de maneira eficiente.
Sobre os 5Vs que caracterizam o Big Data, assinale a afirmativa correta.
Alternativas
Q3174795 Banco de Dados
NoSQL é uma abreviação de Not only SQL (não somente SQL), termo cunhado para definir os novos modelos de armazenamento de dados, criados para atender às necessidades de flexibilidade, disponibilidade, escalabilidade e desempenho das aplicações inseridas no contexto de Big Data.
Esses modelos são classificados de acordo com a estrutura em que os dados são armazenados.
Um deles, especificamente, não considera conceitos como normalização de dados, criação de joins e definição de esquemas rígidos. Ele armazena estruturas flexíveis que podem ser obtidas por meio de dados semiestruturados, como os formatos XML e JSON. Cada uma dessas estruturas armazenadas não contém necessariamente os mesmos atributos, pois não é necessário definir um esquema.
O modelo em questão é o
Alternativas
Q3167194 Banco de Dados

No que se refere à ciência de dados, julgue o item seguinte.


Em big data, representações visuais, como gráficos e dashboards, permitem que padrões sejam rapidamente identificados.

Alternativas
Q3167057 Banco de Dados

Acerca da arquitetura de sistemas analíticos e do ecossistema Apache Hadoop, julgue o próximo item. 


O Hadoop é considerado ineficiente em cenários que exigem escalabilidade horizontal, sendo mais adequado para processamento em clusters pequenos.

Alternativas
Respostas
61: A
62: D
63: C
64: E
65: E
66: E
67: E
68: C
69: C
70: C
71: C
72: D
73: A
74: B
75: E
76: B
77: E
78: A
79: C
80: E