Questões de Concurso Público USP 2025 para Analista de Sistemas
Foram encontradas 60 questões
Com base nas técnicas de pré-processamento citadas, como ficará o texto original após a aplicação de tokenização e remoção de stop words?
class No: def __init__(self, dado): self.dado = dado self.proximo = None
Considere ainda o trecho de código em Python que manipula a Lista Simplesmente Encadeada e que está declarado dentro da classe ListaEncadeada:
A classe ListaEncadeada contém outros métodos que permitem a sua completa manipulação, como inserir elemento no início, inserir elemento no final, exibir conteúdo da lista e remover elementos. Assinale a alternativa que apresenta o conteúdo retornado pelo metodoZ, quando for enviado como parâmetro a seguinte Lista Ligada: [15, 28, 2, 10, 50, 14, 77]
import pandas as pd dados = {'Nome': ['Ivo','Iza','Ney','Ana'], 'Idade': [28, 34, 23, 21], 'Salario': [3000, 4000, 1500, 2000]}
df = pd.DataFrame(dados)
t_idade = df['Idade'].dtype print(f'O tipo da coluna Idade é: {t_idade}')
No código apresentado, foram utilizados dois conceitos importantes sobre o Pandas: DataFrame e dtype. Assinale a alternativa que contém a saída correta do comando print quando o código for executado.
numeros <- c(2, 4, 6, 8, 10) resultado <- 0
for (i in seq_along(numeros)) { if (numeros[i] %% 4 == 0) { resultado <- resultado + numeros[i] } } print(resultado)
Com base na execução desse código, assinale a alternativa que apresenta a saída impressa pelo comando print (resultado).
Considerando o cenário descrito, assinale a alternativa que apresenta a abordagem mais adequada para otimizar a recuperação eficiente e garantir a integridade dos dados.
[35, 42, 38, 40, 1500, 37, 39, 41, 36, 2500, 43, 5000, 38, 44, 3700]
Utilizando o Spark SQL, calcularam a média e o desvio padrão amostral das compras. Um valor é considerado anomalia se estiver acima de 2 desvios padrão da média.
Em relação à situação proposta e à análise, assinale a alternativa que apresenta as transações que podem ser classificadas como anômalas.
Com base nos resultados apresentados, assinale a alternativa que descreve a melhor escolha de representação vetorial para este problema e sua justificativa.
A equipe analisou diferentes abordagens e encontraram os seguintes padrões nos dados:
• Os preços seguem uma tendência crescente ao longo do tempo; • Há um padrão sazonal, com aumentos e quedas recorrentes em períodos específicos; • Os valores atuais são fortemente influenciados pelos valores anteriores.
Com base nas características descritas, assinale a alternativa que apresenta a técnica de modelagem de séries temporais mais adequada para capturar esses padrões e gerar previsões precisas.
Tabela Pedidos (forma não normalizada):
Considerando apenas as regras da 1ª e 2ª formas normais (1FN e 2FN), assinale a alternativa que apresenta a correta normalização da tabela apresentada.
CREATE TABLE Clientes ( Cliente_ID INT PRIMARY KEY, Nome VARCHAR(100), Cidade VARCHAR(100), Estado CHAR(2) );
CREATE TABLE Pedidos ( Pedido_ID INT PRIMARY KEY, Cliente_ID INT, Data_Pedido DATE, Valor_Total DECIMAL(10,2), FOREIGN KEY (Cliente_ID) REFERENCES Clientes(Cliente_ID) );
A consulta SQL, a seguir, retorna quais resultados?
SELECT c.Nome, COUNT(p.Pedido_ID) AS Num_Pedidos, COALESCE(SUM(p.Valor_Total), 0) AS Total_Gasto FROM Clientes c LEFT JOIN Pedidos p ON c.Cliente_ID = p.Cliente_ID WHERE p.Data_Pedido >= '2025-02-01' GROUP BY c.Nome HAVING COUNT(p.Pedido_ID) >= 1;