Julgue o próximo item, relativo à normalização de dados, à ...

Próximas questões
Com base no mesmo assunto
Q3258097 Banco de Dados
Julgue o próximo item, relativo à normalização de dados, à linguagem de definição de dados (DDL), a sistema gerenciador de banco de dados (SGBD) Oracle 21C e a data lake.
A principal característica de um data lake é sua capacidade de armazenar diferentes tipos de dados (estruturados, semiestruturados e não estruturados) sem a necessidade de um esquema antecipadamente definido.  
Alternativas

Gabarito comentado

Confira o gabarito comentado por um dos nossos professores

Gabarito: C (Certo)

A questão aborda o conceito de data lake, uma abordagem moderna para armazenamento de dados. Entender essa questão requer familiaridade com conceitos relacionados a armazenamento e gestão de dados em ambientes de grande escala, típicos em tecnologias de big data.

Um data lake é um repositório centralizado que permite armazenar grandes volumes de dados em suas formas originais. A principal característica que distingue um data lake de outros sistemas de armazenamento, como bancos de dados tradicionais ou data warehouses, é sua flexibilidade.

Características do Data Lake:

  • Armazenamento de dados variados: Capaz de manter dados estruturados (como tabelas de SQL), semiestruturados (como JSON) e não estruturados (como vídeos e imagens).
  • Esquema sob demanda: Permite a ingestão de dados sem um esquema predefinido, ou seja, os dados são armazenados na forma como são recebidos e o esquema é definido no momento da análise (esquema-on-read).

Dessa forma, a alternativa C está correta, pois a descrição dada na questão coincide perfeitamente com a principal característica de um data lake: a capacidade de armazenar diferentes tipos de dados sem a necessidade de um esquema antecipadamente definido.

Por que a alternativa está correta?

Conforme destacado, um data lake é projetado para lidar com a diversidade e volume de dados que muitas organizações coletam atualmente. Isso proporciona uma flexibilidade que é crucial para análises avançadas, aprendizado de máquina e outras operações que exigem acesso a dados em suas formas mais ricas e originais.

Por fim, a questão não apresenta uma alternativa incorreta, mas é essencial lembrar que, ao julgar itens como esse, é importante compreender o contexto tecnológico e a definição precisa dos conceitos, evitando confusões com outros tipos de repositórios de dados mais rígidos, como data warehouses.

Gostou do comentário? Deixe sua avaliação aqui embaixo!

Clique para visualizar este gabarito

Visualize o gabarito desta questão clicando no botão abaixo

Comentários

Veja os comentários dos nossos alunos

data lake armazena dados brutos, conceito básico

DW armazena só dados estruturados após fazer o ETL ou ELT

data mart tá dentro do DW

resuminho decoreba pra acertar

principal característica de um Data Lake é sua flexibilidade para armazenar dados em seu formato bruto (estruturados, semiestruturados e não estruturados) sem exigir um esquema rígido pré-definido (abordagem "schema-on-read"). Isso o diferencia de um Data Warehouse, que segue um modelo estruturado e esquematizado ("schema-on-write").

  1. Armazenamento de Dados Diversificados:
  • Estruturados: Tabelas SQL, CSV.
  • Semiestruturados: JSON, XML, logs.
  • Não estruturados: Imagens, vídeos, PDFs, e-mails.
  1. Schema-on-Read:
  • Os dados são ingeridos em seu formato original, e a estrutura (schema) é aplicada apenas no momento da análise, permitindo maior agilidade na ingestão e adaptabilidade a mudanças.
  1. Escalabilidade Horizontal:
  • Usa armazenamento distribuído (ex.: Hadoop, cloud como AWS S3) para lidar com volumes massivos de dados.
  1. Custos Reduzidos:
  • Armazena dados brutos a baixo custo, sem pré-processamento dispendioso.
  1. Flexibilidade Analítica:
  • Suporta desde análises exploratórias até machine learning e processamento em batch/streaming.
  • Pode virar um "Data Swamp": Se não houver governança, metadados ou controle de qualidade, os dados ficam inutilizáveis.
  • Complexidade de Gestão: Requer ferramentas (ex.: Apache Spark, Delta Lake) para organizar e garantir confiabilidade.

Data Lake é ideal para ambientes que demandam agilidade na ingestão e versatilidade analítica, mas exige boas práticas de governança para evitar problemas de qualidade.

Data Lake: É um repositório utilizado para armazenar grandes volumes de dados em formatos variados incluindo dados brutos não processados, bem como dados semiestruturados e estruturados.

Data Warehouse: É um sistema centralizado de armazenamento de dados projetado especificamente para a consulta e análise de grandes volumes de dados históricos.

Características:

  • Orientado por assunto;
  • Não Volátil;
  • Integrado
  • Histórico.

Corrijam-me se estiver errado.

Data Lake, por sua vez, armazena qualquer tipo de dado (estruturado, semiestruturado e, por fim, não estruturado). Não oferece uma visão multidimensional dos dados.

Data lake estão em estado BRUTO, ou seja, sem verificações, processamentos ou análises.



Data Lake (lago de dados): dados armazenados de forma bruta; vários tipos de dados; sem refinamento; bruto/variado.

Gabarito: CERTO.

Clique para visualizar este comentário

Visualize os comentários desta questão clicando no botão abaixo