Questões de Concurso
Comentadas sobre big data em banco de dados
Foram encontradas 341 questões
A respeito de transformação digital, julgue o item a seguir.
As políticas públicas para a transformação digital dirigem-se preferencialmente a empresas de médio e grande porte, em razão de sua maior capacidade de investimento.
Em relação a manipulação e limpeza de dados, julgue o item a seguir.
A transformação de dados categóricos utilizando codificação one-hot sempre reduz a dimensionalidade do conjunto de dados.
Em relação a manipulação e limpeza de dados, julgue o item a seguir.
A normalização dos dados é importante na preparação de dados para modelos de aprendizado de máquina, pois garante que todas as variáveis estejam na mesma escala, independentemente de sua importância no modelo.
Em relação a manipulação e limpeza de dados, julgue o item a seguir.
Local outlier factor é uma técnica de detecção de outliers que mede a anomalia de um dado com base na densidade local dos seus vizinhos.
Julgue o próximo item, a respeito de machine leaning.
Árvores de decisão são técnicas de modelagem preditiva que particionam iterativamente os dados em subconjuntos homogêneos baseados em variáveis explicativas.
Julgue o próximo item, a respeito de machine leaning.
Os algoritmos de regressão linear, por minimizarem a soma dos resíduos quadrados para ajustar os coeficientes, são sensíveis a outliers, que podem distorcer os coeficientes e comprometer a previsão do modelo.
Julgue o próximo item, a respeito de machine leaning.
Grandes volumes de dados frequentemente revelam padrões e tendências que são valiosos para análises preditivas e tomadas de decisão, facilitando a antecipação de comportamentos futuros e permitindo melhor alocação de recursos e planejamento.
Assinale a opção que melhor define o conceito de veracidade.
I. Enquanto dados não estruturados são normalmente armazenados em seu formato nativo (como vídeos, imagens ou documentos de texto), dados estruturados são armazenados em linhas e colunas e podem ser mapeados para campos predefinidos.
II. Ao contrário dos dados estruturados, que podem ser organizados e acessados por meio de bancos de dados relacionais, dados não estruturados não têm um modelo rígido de organização predefinido.
III. Conjuntos de dados semiestruturados usam tags e marcadores (ou seja, metadados) em vez de exigir um esquema predefinido em tabelas, linhas e colunas, como nos dados estruturados.
IV. Os data lakes podem ser projetados para armazenar dados semiestruturados juntamente com dados estruturados, permitindo a coexistência de dados de ambos os tipos.
Está correto o que se afirma em
1. Apache Kafka. 2. Apache Sqoop.
( ) Muito usado para transferência de dados entre bancos relacionais para o ecossistema Hadoop.
( ) Suas transferências de dados são baseadas em lotes, focando em transferências programadas ou sob demanda.
( ) Muito usado para streaming de dados em tempo real.
( ) Trabalha com mensageria distribuída, baseada no conceito de tópicos, permite que produtores enviem mensagens e consumidores as processem de forma assíncrona.
A associação correta, na ordem apresentada, é
Assinale a opção que apresenta, respectivamente, uma ferramenta que trata do modelo de dados orientado a colunas e outra, do modelo orientado a documentos.
Sobre os 5Vs que caracterizam o Big Data, assinale a afirmativa correta.
Esses modelos são classificados de acordo com a estrutura em que os dados são armazenados.
Um deles, especificamente, não considera conceitos como normalização de dados, criação de joins e definição de esquemas rígidos. Ele armazena estruturas flexíveis que podem ser obtidas por meio de dados semiestruturados, como os formatos XML e JSON. Cada uma dessas estruturas armazenadas não contém necessariamente os mesmos atributos, pois não é necessário definir um esquema.
O modelo em questão é o
No que se refere à ciência de dados, julgue o item seguinte.
Em big data, representações visuais, como gráficos e dashboards, permitem que padrões sejam rapidamente identificados.
Acerca da arquitetura de sistemas analíticos e do ecossistema Apache Hadoop, julgue o próximo item.
O Hadoop é considerado ineficiente em cenários que exigem escalabilidade horizontal, sendo mais adequado para processamento em clusters pequenos.