Uma equipe de dados operacionaliza um pipeline de ingestão d...

Próximas questões
Com base no mesmo assunto
Q4036235 Banco de Dados
Uma equipe de dados operacionaliza um pipeline de ingestão diária que carrega arquivos de diversas fontes para um data warehouse corporativo. Após uma falha em uma das etapas do processo, a equipe precisa analisar os registros de execução (logs) para identificar a causa do problema, o momento da interrupção e quais registros foram processados com sucesso antes da falha. Com base nas boas práticas de registro de execução em pipelines de dados, assinale a alternativa CORRETA.
Alternativas

Gabarito comentado

Confira o gabarito comentado por um dos nossos professores

Gabarito: D

Fundamento decisivo: A decisão estava em reconhecer o conjunto mínimo de campos de um log que permite rastrear a execução e localizar a falha; isso coincide com a alternativa D.

Tema central: logging em ETL
Análise das alternativas
A
Errada
Está errada porque trata logging como opcional e restrito a certos ambientes. Isso contraria o critério básico de observabilidade: sem logs não há rastreabilidade, diagnóstico de falhas nem auditoria mínima de execução em um pipeline operacional.
B
Errada
Está errada porque inverte a função dos logs estruturados. Formatos como JSON favorecem parsing, indexação, correlação e consulta automatizada; portanto, dizer que dificultam a análise automatizada e que texto livre é preferível confronta diretamente a boa prática indicada na base.
C
Errada
Está errada porque generaliza que armazenar logs no banco transacional de origem seria a abordagem mais segura. A base afasta essa conclusão: isso mistura dados de negócio com observabilidade e não constitui, por si só, boa prática geral de resiliência, disponibilidade ou preservação em falhas.
D
Certa
A alternativa D está correta porque reúne os elementos mínimos de um log de execução eficaz para pipeline ETL: identificar a execução, registrar início e término de cada etapa, informar o status e indicar o volume de registros processados. Esse conjunto sustenta exatamente as finalidades cobradas: rastreabilidade, localização do ponto de falha, verificação do que concluiu com sucesso antes da interrupção e auditoria operacional.
E
Errada
Está errada porque afirma de forma absoluta que o descarte automático após sucesso não compromete a auditoria. A retenção de logs depende de requisitos operacionais, regulatórios e forenses; por isso, essa conclusão não pode ser feita genericamente.
Pegadinha da questão
A questão explorou confusões comuns: achar que log é acessório, que log estruturado atrapalha automação, ou que reduzir armazenamento por descarte automático sempre preserva auditoria. O filtro correto era reconhecer quais campos mínimos tornam o log realmente útil para localizar a falha e medir o que já foi processado.
Dica para questões semelhantes
  • Se o problema pede rastrear falha em pipeline, procure a alternativa que traga identificação da execução, marcação temporal por etapa, status e volume processado.
  • Desconfie de alternativas que tratem logging como opcional em processos operacionais.
  • Em questões sobre observabilidade, logs estruturados tendem a favorecer automação, consulta e correlação.
  • Afirmações absolutas sobre retenção ou local de armazenamento de logs costumam estar erradas quando ignoram requisitos de auditoria e resiliência.

Clique para visualizar este gabarito

Visualize o gabarito desta questão clicando no botão abaixo