Questões de Concurso Sobre etl (extract transform load) em banco de dados

Foram encontradas 211 questões

Q4132404 Banco de Dados
Assinale a alternativa que representa um conceito relacionado ao tratamento e análise de dados. 
Alternativas
Q4067459 Banco de Dados
Diante da integração de cadastros de contribuintes provenientes de múltiplos sistemas fiscais, sujeitos a divergências semânticas em relação à Classificação Nacional de Atividades Econômicas (CNAE), abreviações e classificações internas, e visando garantir rastreabilidade para audítoria e reprocessamento, a técnica de pré-processamento adequada ao cenário apresentado é
Alternativas
Q4048574 Banco de Dados

Um analista de dados de uma agência reguladora está desenvolvendo um painel para monitorar indicadores de desempenho do setor. Ele está utilizando uma ferramenta de BI que envolve um processo de ETL (Extração, Transformação e Carga) para preparar os dados.

Analise as seguintes proposições sobre as etapas do processo de BI: 


I. Extração (Extract): É a fase de coleta de dados de diversas fontes, que podem ser bancos de dados relacionais (SQL Server, Oracle), planilhas (Excel), arquivos de texto (CSV), serviços web (APIs), entre outros.

II. Transformação (Transform): Nesta fase, os dados extraídos são limpos, padronizados, combinados e modelados. Podem ser realizadas operações como remoção de duplicatas, cálculo de novas colunas e criação de hierarquias para preparar os dados para a análise.

III. Carga (Load): Após a transformação, os dados são carregados no modelo de dados da ferramenta de BI (como o Power BI ou Qlik Sense), onde ficarão disponíveis para a criação de relatórios e dashboards interativos.


Está correto o que se afirma em:

Alternativas
Q4036241 Banco de Dados
O profiling de dados é uma etapa analítica realizada sobre conjuntos de dados com o objetivo de compreender sua estrutura, qualidade e distribuição antes de iniciar processos de transformação ou carga em camadas analíticas. A realização adequada do profiling permite identificar problemas de qualidade e orientar as regras de tratamento a serem aplicadas no pipeline. Diante disso, analise as afirmativas a seguir sobre profiling básico de dados:
I. A análise de cardinalidade em uma coluna consiste em identificar o número de valores distintos presentes, sendo útil para reconhecer possíveis chaves candidatas e detectar colunas com baixa variabilidade que podem indicar problemas de qualidade.
II. O profiling de nulidade verifica a proporção de valores ausentes em cada coluna, fornecendo informações relevantes para decisões sobre estratégias de tratamento, como imputação, exclusão de registros ou criação de indicadores de ausência.
III. A análise de distribuição de frequência permite identificar quais valores ocorrem com maior regularidade em uma coluna e é aplicável exclusivamente a colunas com tipos de dados numéricos, não sendo útil para colunas do tipo texto ou categórico.
IV. O profiling básico, por ser uma análise estática realizada antes da ingestão, elimina a necessidade de validações de qualidade posteriores durante as fases de transformação e carga, desde que o dataset analisado não sofra alterações estruturais.
Estão CORRETAS: 
Alternativas
Q4036239 Banco de Dados

O formato CSV é amplamente utilizado em pipelines de dados para transferência de conjuntos de dados entre sistemas heterogêneos. Apesar de sua simplicidade, o formato apresenta características e limitações técnicas que devem ser consideradas durante a implementação de processos de ingestão e integração. Diante disso, analise as afirmativas a seguir sobre o formato CSV:


I. O formato CSV não incorpora um esquema de dados embutido no arquivo, o que exige que os tipos, significados e formatos de cada coluna sejam documentados externamente ou inferidos durante a leitura.
II. Um arquivo CSV suporta a representação nativa de dados hierárquicos e aninhados, como listas de itens vinculados a um único registro pai, desde que os delimitadores aninhados sejam configurados corretamente no parser utilizado.
III. Quando um valor de campo contém o caractere delimitador, esse campo deve ser envolvido entre aspas duplas para que o parser o interprete como um único valor, conforme previsto pela especificação RFC 4180.
IV. A codificação de caracteres utilizada em um arquivo CSV é declarada de forma explícita no próprio arquivo, garantindo que sistemas distintos realizem a leitura correta dos dados sem necessidade de configuração adicional.

Está(ão) CORRETA(S):

Alternativas
Q4036238 Banco de Dados
Na gestão de qualidade de dados em pipelines de ingestão, a aplicação de regras de validação e consistência é etapa essencial para assegurar que os dados disponibilizados nas camadas de consumo sejam confiáveis, completos e coerentes. O descumprimento dessas regras pode comprometer análises, relatórios e decisões de negócio suportadas pela plataforma de dados. Com base nas técnicas e conceitos de validação e consistência de dados, assinale a alternativa INCORRETA.
Alternativas
Q4036235 Banco de Dados
Uma equipe de dados operacionaliza um pipeline de ingestão diária que carrega arquivos de diversas fontes para um data warehouse corporativo. Após uma falha em uma das etapas do processo, a equipe precisa analisar os registros de execução (logs) para identificar a causa do problema, o momento da interrupção e quais registros foram processados com sucesso antes da falha. Com base nas boas práticas de registro de execução em pipelines de dados, assinale a alternativa CORRETA.
Alternativas
Q4036223 Banco de Dados

No contexto de Business Intelligence (BI), o desenvolvimento de Datamarts e a execução de processos de ETL (Extract, Transform, Load) são fundamentais para organizar, integrar e disponibilizar informações de forma eficiente para análise gerencial. Com base nesses conceitos, analise as assertivas a seguir sobre Datamarts e ETL e julgue-as em Verdadeiras (V) ou Falsas (F):


(  ) Uma estrutura de Datamarts é do tipo Star Schema, na qual a estrutura de dimensões é normalizada (dimensões divididas em subdimensões).
(  ) Uma estrutura de Datamarts é do tipo Snowflake Schema, na qual a estrutura de dimensões é desnormalizada (tudo em uma tabela).
(  ) No ETL, especificamente na etapa de Load, um dos tipos de carregamento é full load, em que todos os dados existentes são substituídos pelo novo conjunto.
(  ) No ETL, especificamente na etapa de Transform, uma atividade pode ser de derivação, por exemplo, criar campos novos a partir de existentes (ex.: lucro = receita - custo).

Qual alternativa preenche, CORRETAMENTE, de cima para baixo, os parênteses acima?

Alternativas
Q3968385 Banco de Dados
Em um pipeline de dados, o modelo ETL (Extract, Transform, Load) caracteriza-se pela realização das transformações antes da carga dos dados no sistema de destino, enquanto o modelo ELT (Extract, Load, Transform) adia as transformações para depois da ingestão dos dados em um ambiente analítico. Nesse contexto, a alternativa mais coerente com os impactos em escalabilidade, custo computacional e planejamento em cenários de big data é: 
Alternativas
Q3964128 Banco de Dados
Considere, hipoteticamente, que o SAAE de Indaiatuba implantou uma solução de BI para acompanhar indicadores como consumo médio por região, inadimplência, perdas na distribuição de água e eficiência operacional. Para isso, foi planejada a criação de Datamarts alimentados periodicamente a partir dos sistemas transacionais existentes. Sobre os conceitos de Datamarts e processos ETL, no contexto de soluções de BI, assinale a afirmativa correta. 
Alternativas
Q3956763 Banco de Dados
Uma Secretaria da Fazenda Estadual recebeu uma base de dados contendo 2,3 milhões de registros de declarações fiscais para análise de conformidade tributária. Durante a fase de exploração inicial, a equipe técnica identificou diversos problemas: campos de CNPJ com formatações inconsistentes (alguns com pontuação, outros sem), valores monetários registrados com separadores decimais divergentes (vírgula e ponto), datas em formatos distintos (DD/MM/AÄAA, AAAA-MM-DD), campos obrigatórios vazios em aproximadamente 12% dos registros, e a presença de valores extremos de receita bruta (outliers) que distorciam as análises estatísticas. Além disso, a variável "regime tributário" apresentava categorias redundantes devidoa erros de digitação (ex: "Simples Nacional", "SIMPLES NACIONAL", "Simples nacional"). Para viabilizar a análise de risco fiscal e a construção de modelos preditivos, tornou-se necessário aplicar técnicas sistemáticas de preparação dos dados antes do processamento analítico. Considerando as melhores práticas de pré-processamento de dados, o tratamento correto e adequado para essa situação é
Alternativas
Q3953486 Banco de Dados
No processo de descoberta de conhecimento em bases de dados, a qualidade dos resultados obtidos pelos algoritmos de aprendizado de máquina está diretamente vinculada à qualidade dos dados de entrada. Dados provenientes de fontes heterogêneas, frequentemente, apresentam ruídos, redundâncias e lacunas que podem enviesar as análises estatísticas.
Dentro do fluxo de trabalho de Ciência de Dados, o conjunto de operações que envolve o tratamento de dados faltantes (null/missing values), a normalização de formatos, a remoção de registros redundantes e a correção de erros de digitação ou inconsistências lógicas é tecnicamente denominado
Alternativas
Q3952854 Banco de Dados
Com relação aos conceitos e tipos ELT e ETL de pipeline de dados, analise as afirmativas a seguir.

I. A abordagem ELT é recomendada para tarefas relacionadas a LGPD porque realiza a limpeza de dados sensíveis antes que eles atinjam o sistema de destino, reduzindo riscos de segurança e economizando espaço de armazenamento.
II. No processo ETL, o conjunto de dados completo e sem tratamento é carregado diretamente no sistema de destino. Como há apenas uma etapa, e ela ocorre apenas uma vez, o carregamento no processo ETL é mais rápido do que no ELT.
III. Na abordagem ELT, é possível aproveitar o poder de processamento distribuído e a escalabilidade elástica do data warehouse de destino para realizar transformações via SQL, eliminando a necessidade de um servidor de processamento intermediário.

É verdadeiro o que é afirmado em
Alternativas
Q3940725 Banco de Dados

O processo de ETL (Extract, Transform, Load) é fundamental para a construção de Data Warehouses.



Qual etapa do processo de ETL é responsável por converter os dados extraídos para um formato consistente e adequado para análise?

Alternativas
Q3932861 Banco de Dados

No que se refere aos processos de ETL (extract, transform, load) e a técnicas de pré-processamento de dados para classificação e visualização de dados, julgue o próximo item.


Em um gráfico de dispersão, se os valores do eixo vertical diminuírem à medida que os valores do eixo horizontal aumentarem, a direção será considerada positiva.

Alternativas
Q3932860 Banco de Dados

No que se refere aos processos de ETL (extract, transform, load) e a técnicas de pré-processamento de dados para classificação e visualização de dados, julgue o próximo item.


Em ETL, a transformação de uma linha que contém colunas com múltiplas ocorrências em uma linha para cada instância dos dados com múltiplas ocorrências é um exemplo de normalização de dados da etapa transform.

Alternativas
Q3926893 Banco de Dados
Uma Secretaria da Fazenda projeta um Data Lake para suportar fiscalização eletrônica, com ingestão diária de notas fiscais eletrônicas, conhecimentos eletrônicos de transporte de cargas, registros fiscais digitais entregues ao fisco, declarações do SIMPLES Nacional e recolhimentos. A equipe adota uma arquitetura em zonas (raw/bronze, refined/silver, curated/gold), com processos de ELT. Para o uso por auditores fiscais e cientistas de dados, a descrição mais adequada é que a zona raw/bronze
Alternativas
Q3886855 Banco de Dados

No que diz respeito a Big Data, ETL/ELT e metadados, julgue o próximo item.


Uma das técnicas utilizadas na etapa de transformação do processo de ETL é a derivação, em que são vinculados dados semelhantes oriundos de diferentes fontes de dados.

Alternativas
Q3885600 Banco de Dados
No processo de ETL, a fase de Transformação é a mais crítica para garantir a qualidade e a consistência dos dados que serão carregados no Data Warehouse.
Assinale a opção que descreve uma operação tipicamente executada na fase de Transformação.
Alternativas
Q3871765 Banco de Dados
Assinale a alternativa que descreve o conceito de transformação de dados em um processo de ETL (Extract, Transform, Load).  
Alternativas
Respostas
1: A
2: C
3: E
4: B
5: C
6: A
7: D
8: A
9: A
10: D
11: E
12: A
13: D
14: D
15: E
16: C
17: E
18: E
19: B
20: B