Foram encontradas 1.880 questões
Resolva questões gratuitamente!
Junte-se a mais de 4 milhões de concurseiros!
Assinale a opção que não representa uma característica típica de um data warehouse
Ferramentas de Big Data permitem processar, armazenar, analisar e visualizar dados de forma altamente eficiente e escalável. Analise as afirmações quanto às características de tais ferramentas.
I. Baixa tolerância a falhas.
II. Processamento paralelo e distribuído.
III. Esquemas rígidos obrigatórios.
IV. Armazenamento centralizado exclusivo.
V. Escalabilidade horizontal.
Estão corretas as afirmações apresentadas em:
Com relação ao uso de modelagem relacional e multidimensional, avalie as afirmativas a seguir e assinale (V) para verdadeira e (F) para falsa.
( ) A Modelagem Relacional busca garantir, com emprego da técnica de desnormalização, a integridade dos dados e a eficiência nas operações do dia-a-dia, como inserir, atualizar e excluir informações.
( ) A Modelagem Multidimensional busca otimizar, pela elevada normalização dos dados, a consulta e a agregação de grandes volumes de dados para análises complexas.
( ) A Modelagem Relacional está focada em sistemas operacionais e transacionais (OLTP - Online Transaction Processing), enquanto a Modelagem Multidimensional foca em sistemas de análise e tomada de decisão (OLAP - Online Analytical Processing), como Data Warehouses e sistemas de Business Intelligence (BI).
As afirmativas são, segundo a ordem apresentada,
I. Criar ou abrir um projeto de visualização de dados ao qual deseja adicionar o conjunto de dados. Para criar um projeto novo, ele deverá acessar a Página Inicial, clicar em “New” e, em seguida, clicar em “Project” para exibir a caixa de diálogo “Add Data Set”.
II. Localizar a caixa de diálogo “Add Data Set”, selecionar os conjuntos de dados que deseja analisar e, em seguida, clicar em “Add to Project”.
III. Para visualizar dados de outro conjunto de dados no mesmo projeto, localizar o painel “Data Elements”, clicar em “Add” e, em seguida, selecionar “Add Data Set”.
IV. Por fim, o analista deverá arrastar os elementos de dados que deseja visualizar do painel “Data Elements” e começar a criar seu projeto.
Está correto o que se afirma em
1. Anomalias não intencionais.
2. Anomalias pontuais.
3. Anomalias contextuais.
4. Anomalias coletivas.
( ) Essas anomalias, também conhecidas como valores discrepantes globais, são pontos de dados individuais que estão muito fora do restante do conjunto de dados. Um exemplo desses tipo anomalia é um saque de conta bancária que é significativamente maior do que qualquer um dos saques anteriores do usuário;
( ) Essas anomalias envolvem um conjunto de instâncias de dados que juntas se desviam da norma, mesmo que as instâncias individuais possam parecer normais. Um exemplo desse tipo de anomalia seria um conjunto de dados de tráfego de rede que mostra um aumento repentino no tráfego de vários endereços IP ao mesmo tempo;
( ) Essas anomalias são pontos de dados que se desviam da norma devido a erros ou ruído no processo de coleta de dados. Esses erros podem ser sistemáticos ou aleatórios, originados por problemas como sensores defeituosos ou erro humano durante a entrada de dados. Esse tipo de anomalia pode distorcer o conjunto de dados, dificultando a obtenção de insights precisos;
( ) Essas anomalias são pontos de dados que se desviam da norma dentro de um contexto específico. Essas anomalias não são necessariamente valores discrepantes quando consideradas isoladamente, mas se tornam anômalas quando vistas dentro de seu contexto específico. Por exemplo, considere o uso de energia. Se houver um aumento repentino no consumo de energia ao meio-dia, quando normalmente nenhum membro da família está em casa. Este dado pode não ser um valor discrepante quando comparado ao consumo de energia pela manhã ou à noite (quando as pessoas geralmente estão em casa), mas é anômalo em relação ao horário em que ocorreu.
A relação correta, na ordem dada, é:
De acordo com as instruções de publicação de conjunto de dados do Portal de Dados Abertos, a licença de uso que João deve informar é:
Essa escolha é tecnicamente justificada pela capacidade intrínseca desse modelo de:
A principal vantagem da escolha inicial pelo data lake reside no fato de que ele permite:
• (Comando 1) Criação de tabela de produtos CREATE TABLE Produto ( id_produto INT PRIMARY KEY, nome VARCHAR(120) NOT NULL, preco NUMERIC(10,2) NOT NULL, quantidade INT NOT NULL );
• (Comando 2) Inserção de dado inicial INSERT INTO Produto (id_produto, nome, preco, quantidade) VALUES (1, 'Mouse Óptico', 49.90, 100);
• (Comando 3) View para produtos sem estoque CREATE VIEW vw_produtos_em_falta AS SELECT id_produto, nome FROM Produto WHERE quantidade = 0;
• (Comando 4) Procedure para atualizar preço CREATE PROCEDURE atualizar_preco(p_id INT, p_preco NUMERIC(10,2)) BEGIN UPDATE Produto SET preco = p_preco WHERE id_produto = p_id; END;
• (Comando 5) Trigger para log de mudanças de preço CREATE TRIGGER trg_log_preco AFTER UPDATE OF preco ON Produto FOR EACH ROW BEGIN INSERT INTO LogAlteracoes(id_produto, campo, valor_antigo, valor_novo, dt_evento) VALUES (OLD.id_produto, 'preco', OLD.preco, NEW.preco, CURRENT_TIMESTAMP); END;
• (Comando 6) Atualização de quantidade UPDATE Produto SET quantidade = quantidade - 1 WHERE id_produto = 1;
• (Comando 7) Remoção de produtos sem estoque DELETE FROM Produto WHERE quantidade = 0;
• (Comando 8) Concessão de permissão de leitura GRANT SELECT ON Produto TO analista;
• (Comando 9) Alteração de esquema da tabela ALTER TABLE Produto ADD COLUMN ativo BOOLEAN DEFAULT TRUE;
• (Comando 10) Revogação de permissão de inserção REVOKE INSERT ON Produto FROM analista;
As instruções do tipo DML são executadas nos comandos:
• campos numéricos com valores negativos que não fazem sentido (como "idade" ou "renda");
• colunas categóricas com múltiplas grafias para a mesma categoria (ex: "PE", "pe", "Pernambuco");
• presença de valores nulos em campos-chave como “renda” e “número de dependentes”;
• valores repetidos na chave primária “ID cliente”.
Com base nas dimensões de qualidade de dados e nas boas práticas de tratamento com Python - especialmente usando Pandas -, é correto afirmar que a:
Em relação ao processo de ETL, assinale a afirmativa correta.
Assinale a opção que indica a propriedade segundo a qual, após a confirmação de uma transação, as alterações realizadas devem permanecer no banco de dados e não podem ser perdidas em caso de falhas no sistema.
Sistema 1: uma base de dados para armazenar perfis de servidores públicos e suas informações funcionais (dados estruturados e semiestruturados, com variações entre os cargos e históricos de alterações).
Sistema 2: uma aplicação para análise de relacionamentos entre empresas e servidores, com foco em investigações de conflito de interesse, utilizando conexões como vínculos societários, contratos, nomeações e relações familiares.
Nesse contexto, a combinação de modelos NoSQL mais apropriada para atender eficientemente as necessidades dos sistemas 1 e 2 é, respectivamente,
O gestor de TI detectou um problema: em determinados momentos, o sistema calcula valores com base em registros de frequência que são modificados por outra transação ainda em andamento, resultando em inconsistência nos valores pagos.
Para evitar esse problema, a equipe propõe ajustar o nível de isolamento da transação utilizada durante o cálculo da folha, de forma que os dados lidos não possam ser modificados ou inseridos por outras transações até que a atual seja concluída.
Com base nesse cenário, o nível de isolamento mais apropriado para evitar leituras inconsistentes causadas por alterações concorrentes é:
Sobre a mineração de dados, assinale a afirmativa correta.
Com base no relato, é correto afirmar que o tipo em questão é orientado a: