Questões de Concurso Sobre banco de dados
Foram encontradas 18.739 questões
Julgue o próximo item, referente à bioinformática.
Na modelagem de dados de sequenciamento, os tratamentos dos dados de forma heurística, por eles serem lineares, não geram modelos utilizáveis de forma generalizada.
Para atender aos requisitos de um departamento municipal de produtos agrícolas sobre a movimentação temporal entre locais dos produtos estocados, uma Analista criou e populou as seguintes tabelas Fato e Dimensões usando o modelo snowflake:

A seguir, ela escreveu corretamente a seguinte consulta SOL, que somou os produtos estocados em cada local para os anos de 2023 e 2024 e ordenou os resultados do local mais movimentado para o menos movimentado:
• Bairros: Contém informações sobre cada bairro, Incluindo um ID único, nome e coordenadas geográficas.
• Rotas: Contém informações sobre as rotas existentes entre os bairros, como ID da rota, bairro de origem, bairro de destino, distância, tempo estimado, condição da estrada e custo estimado.
Em uma consulta utilizando INNER JOIN, a expressão SOL correta para encontrar a rota mais eficiente entre dois bairros específicos, com base nos critérios definidos pelo órgão, é
• id (INT): Identificador único do processo
• numero_processo (VARCHAR): Número do processo
• descricao (VARCHAR): Descrição do processo
• data_inicio (DATE): Data de início do processo
• status (VARCHAR): Status atual do processo (ex: 'Em andamento, 'Concluído', 'Pendente')
• responsável (VARCHAR): Nome do responsável pelo processo
A consulta SOL correta que retorna todos os processos que estão 'Em andamento' e foram iniciados no ano de 2023, ordenados pela data de início em ordem crescente, é
I. Processa dados em true real-time, lidando com cada evento assim que ele chega.
II. O modo de micro-batch introduz um pequeno delay (latência) entre a ingestão e o processamento dos dados devido à coleta em lote.
III. Mostra um fluxo mais continuo de resultados, especialmente se nenhum windowing ou batching estiver envolvido.
IV. Mais adequado para pipelines de ETL e análises de logs, nos quais a latência dos micro-batching é aceitável.
V. O modelo de processamento de fluxo real garante semântica exactly-once para o processamento de eventos, o que é essencial para aplicações críticas.
As características estão corretamente atribuídas às ferramentas em:
Julgue o item seguinte, relativo à ciência de dados.
Diferentemente do ETL (extração, transformação e carga), o ELT carrega os dados para que sejam manipulados em um data lake, que é um ambiente preparado para armazenar dados, estruturados e não estruturados, em larga escala.
Em relação à base de dados, julgue o próximo item.
Nos bancos de dados relacionais, uma relação N:N entre duas tabelas resulta na criação de uma terceira tabela, para armazenar essa relação.
Em relação à base de dados, julgue o próximo item.
Os bancos de dados NoSQL do tipo documento organizam os registros em um dicionário de pares de chave-valor, em que cada item tem uma chave e um valor.
Em relação ao data warehouse, ao data lake e ao tratamento de dados, julgue o item seguinte.
A distância de Mahalanobis é uma medida estatística que indica quantos desvios‑padrão um determinado valor está da média. Ela é utilizada para identificar outliers em dados multidimensionais.
Em relação ao data warehouse, ao data lake e ao tratamento de dados, julgue o item seguinte.
O objetivo principal da discretização é reduzir a dimensionalidade dos dados.