Questões de Concurso
Nível médio
Foram encontradas 545.841 questões
Resolva questões gratuitamente!
Junte-se a mais de 4 milhões de concurseiros!
O versionamento de código é uma prática essencial no desenvolvimento de software, permitindo que múltiplos desenvolvedores colaborem de forma organizada, mantenham um histórico de alterações e revertam mudanças quando necessário. O Git, um dos sistemas de controle de versão mais populares, fornece uma série de comandos que auxiliam na gestão do código-fonte. Considere o seguinte conjunto de comandos executados em um repositório Git:
Com base nos comandos apresentados, assinale a alternativa correta.
Considere os dois trechos de código a seguir, ambos escritos na Linguagem R. O primeiro utiliza o pacote tidyverse, enquanto o segundo utiliza caret para o mesmo propósito.
Em relação aos códigos apresentados, assinale a alternativa correta.
Um desenvolvedor foi contratado para criar um sistema web para uma pequena startup que deseja lançar um MVP (Produto Mínimo Viável) de uma plataforma de cursos online.
O objetivo inicial é disponibilizar um catálogo de cursos, permitir o cadastro de usuários e oferecer um painel administrativo para gerenciar os conteúdos.
A startup tem poucos recursos e precisa lançar a plataforma rapidamente. O desenvolvedor deseja escolher um framework que permita crescer e escalar o projeto futuramente, caso o produto tenha sucesso.
Considerando o cenário descrito, assinale a alternativa que apresenta a melhor escolha para o desenvolvedor e sua justificativa.
Uma empresa está implementando uma estratégia de Business Intelligence (BI) para melhorar a análise de seus dados operacionais. Para isso, a equipe de dados precisa criar dashboards interativos e realizar análises avançadas usando Power BI e Tableau.
Durante o desenvolvimento dos relatórios, os analistas se depararam com os seguintes desafios:
• Precisam criar uma métrica personalizada para calcular a média ponderada de preços com base no volume de vendas.
• Desejam otimizar o tempo de carregamento ao lidar com milhões de registros armazenados em um banco de dados relacional.
• Precisam implementar um filtro dinâmico que permita ao usuário selecionar intervalos de datas personalizados sem afetar cálculos em outros gráficos.
Com base nos desafios acima, assinale a alternativa que apresenta as melhores soluções utilizando as funcionalidades nativas do Power BI e do Tableau.
Uma equipe de cientistas de dados está desenvolvendo um pipeline de ETL (Extract, Transform, Load) para processar grandes volumes de dados diariamente. Para isso, eles decidiram utilizar o Apache Airflow para orquestrar e monitorar o fluxo de trabalho, garantindo a execução das tarefas na ordem correta e com tolerância a falhas.
No Apache Airflow, os DAGs (Directed Acyclic Graphs) são a estrutura principal usada para definir os workflows. Dentro de uma DAG, as tarefas são organizadas e executadas de acordo com suas dependências.
Assinale a alternativa que melhor descreve o funcionamento de um DAG no Apache Airflow.
Uma rede de supermercados deseja entender os padrões de compra dos clientes para organizar melhor seus produtos e otimizar suas estratégias de vendas. Para isso, a equipe de análise de dados decidiu utilizar um algoritmo de descoberta de regras de associação para identificar itens, frequentemente, comprados juntos.
Assinale a alternativa que representa a métrica fundamental para avaliar a relevância de uma regra de associação.
Uma empresa deseja implementar uma arquitetura de dados robusta para dar suporte à análise e ao processamento diário de informações. A empresa já possui um sistema de OLTP, mas agora precisa de uma solução de OLAP para análise histórica e de tendências. Além disso, a equipe de TI está considerando a criação de Data Marts para áreas de marketing, vendas e finanças, com o objetivo de melhorar a tomada de decisões.
Com base no cenário apresentado, assinale a alternativa que melhor descreve a relação entre Data Marts, OLTP e OLAP.
Durante uma análise exploratória de dados (EDA), um cientista de dados está avaliando a dispersão de um conjunto de dados financeiros que contém informações sobre variações diárias no preço de uma ação. Ele deseja utilizar uma métrica que atenda os seguintes requisitos:
• Leve em conta todos os valores da amostra para evitar que outliers distorçam excessivamente a análise.
• Seja expressa na mesma unidade de medida dos dados originais, facilitando a interpretação dos resultados.
• Permita comparar a variabilidade entre diferentes ativos, mesmo que tenham médias diferentes.
Dado esse contexto, assinale a alternativa que apresenta a técnica estatística que melhor atende aos requisitos mencionados
Considere a tabela Funcionarios de um banco de dados de uma empresa:
Qual das consultas, a seguir, retorna, corretamente, o nome, o cargo e o salário de todos os funcionários que ganham mais de R$ 3.000,00, ordenados em ordem decrescente de salário?
Uma empresa precisa processar grandes volumes de dados e está avaliando a adoção de Apache Hadoop ou Apache Spark para suas operações. A equipe técnica analisou as características de cada tecnologia e fez as seguintes observações:
• A equipe deseja minimizar a latência no processamento dos dados.
• O projeto exige suporte para análise de dados em tempo real.
• O orçamento disponível permite a utilização de mais memória RAM, se necessário.
• A infraestrutura já possui um Data Lake armazenado no HDFS.
Com base nas informações apresentadas, assinale a alternativa que representa a escolha mais adequada e o seu principal motivo.
Uma empresa que trabalha e armazena dados sensíveis de clientes, como informações bancárias e documentos pessoais, precisa estabelecer um protocolo seguro para o descarte de informações, garantindo conformidade com legislações como a LGPD (Lei Geral de Proteção de Dados). No entanto, devido a falhas nos procedimentos internos, documentos impressos com dados de clientes foram descartados em lixeiras comuns e, posteriormente, encontrados por terceiros.
Diante do cenário descrito, assinale a alternativa que apresenta uma análise correta sobre as implicações e responsabilidades do descarte inadequado de informações sensíveis.
A Inteligência Artificial tem sido amplamente utilizada para personalizar o ensino e otimizar diagnósticos médicos. No entanto, seu uso pode gerar efeitos adversos inesperados, especialmente em contextos de desigualdade social.
Considerando as implicações éticas e práticas da IA em setores essenciais, qual abordagem representa um uso responsável da tecnologia?