Questões de Concurso Público IF-SP 2022 para Analista de Tecnologia da Informação - Ciência de Dados

Foram encontradas 50 questões

Q3972703 Noções de Informática
O Microsoft Word é um processador de texto desenvolvido pela Microsoft, o qual possui diversos recursos que permitem a criação de documentos profissionais. Um desses recursos permite que o documento possa ser dividido em partes independentes. Assinale a alternativa que indica o recurso responsável por permitir a inserção de cabeçalhos diferentes dentro das páginas de um mesmo documento do Microsoft Word.
Alternativas
Q3972704 Segurança da Informação
Os ataques virtuais estão sempre evoluindo em sua forma e aplicação, conforme novas vulnerabilidades de sistemas são descobertas. Um tipo de ataque virtual que vêm se popularizando e que acontece quando um software malicioso obtém acesso a uma rede, se espalha e criptografa as informações a que tem acesso, e depois cobra um valor de resgate pela chave de decriptação da informação roubada, é chamado de:
Alternativas
Q3972705 Noções de Informática
O envio de e-mails facilita a comunicação e registro de ações dentro de uma instituição, mas um envio para destinatários de maneira errada pode expor a privacidade de endereços de destinatários para quem não deveria ter acesso a essas informações. Sobre o controle de privacidade de destinatários de um e-mail, considere as afirmações abaixo:

I – O campo “Para” é onde se coloca os destinatários principais da mensagem;

II – O campo “Cc” serve para enviar uma cópia da mensagem para um ou mais destinatários, mas oculta os destinatários que receberam as cópias da mensagem;

III – O campo “Para” pode ter somente um destinatário;

IV – O campo “Cco” envia cópia da mensagem para os destinatários e deixa público todos os endereços que receberam a mensagem;

V – O campo “Cco” oculta os endereços dos destinatários que receberam a mensagem.


São CORRETAS as afirmações:
Alternativas
Q3972706 Noções de Informática
Como forma de organizar o setor de licitações, o Coordenador de Licitações e Contratos do IFSP solicitou ao seu subordinado que criasse no Windows uma estrutura de diretórios conforme ilustrado na figura a seguir. O subordinado encontrou dificuldades para concluir a tarefa e não conseguiu criar uma das pastas solicitadas. Todas as demais foram criadas com sucesso.


Imagem associada para resolução da questão

Fonte: IFSP, 2022.

Dessa forma, é possível afirmar que existem alguns caracteres especiais que não são permitidos para nomear e renomear diretórios e arquivos no Windows. Considerando o caso relatado, assinale a alternativa em que todos os caracteressão proibidos:
Alternativas
Q3972707 Noções de Informática
O setor de gestão de pessoas do IFSP deseja automatizar uma planilha de controle de servidores em estágio probatório. Conforme a imagem abaixo, indique qual função deve ser construída na célula D9 para retornar o total de servidores em estágio probatório.


Imagem associada para resolução da questão
Alternativas
Q3976941 Programação
Trabalhar com álgebra linear está associado aos vetores e matrizes, com suas regras e cálculos. Para isso, é necessário conhecer tanto a matemática envolvida quanto os recursos da linguagem de programação. Assinale a alternativa correta que implementa o cálculo algébrico apresentado:

Captura_de tela 2026-04-07 141137.png (419×101)

Sendo D = (A+B)•C
Alternativas
Q3976942 Estatística

Os métodos de regressão linear são utilizados para se buscar soluções por polinômios ou métodos iterativos que possibilitem estimar os valores de f(x), considerando-se um certo x de entrada. Uma das soluções é pelo Método dos Mínimos quadrados, que consiste em escolher os α de tal forma que a soma dos quadrados dos desvios seja mínima, ou seja, de acordo com o critério dos quadrados mínimos, os coeficientes αk, que fazem com que φ(x) se aproxime ao máximo de f(x) descrito por

Captura_de tela 2026-04-07 141253.png (299×85)

Assinale a alternativa em que se tem valor mais aproximado do cálculo pelo método dos mínimos quadrados, considerando α = 2,1831, x = 0,32 e o f(x) = x2. Repare que os dados dessa análise podem ser visualizados no gráfico a seguir.


Captura_de tela 2026-04-07 141303.png (724×409)



Fonte: IFSP, 2022.

Alternativas
Q3976943 Engenharia de Software
Nos modelos de aprendizado de máquina, existem dois problemas básicos que devem ser considerados. O primeiro problema é o sobreajuste (overfitting) que acontece quando se tem um modelo com bom desempenho com os dados treinados, mas que não trabalha bem com novos dados. Já o segundo problema, é o sub-ajuste (underfitting) que já sequer trabalhar com os dados de treino e, consequentemente, na aplicação em si. Para isso, é necessário implementar modelos que sejam equilibrados para atender as demandas. Considerando essas afirmações e a figura a seguir, selecione a alternativa que melhor associa o problema com os dados dispostos no espaço com a solução equilibrada, com sub-ajuste e sobreajuste de acordo com sua indicação (I, II e III).

Captura_de tela 2026-04-07 141340.png (618×159)

Fonte: IFSP, 2022.
Alternativas
Q3976944 Matemática
No aprendizado de máquina, é necessário conhecer os modelos e os recursos numéricos que melhor se adequam ao problema de interesse. Em problemas de agrupamento, o modelo deve possuir recursos para realizar medições intra-agrupamento e também entre os elementos de um mesmo grupo. Considerando a figura a seguir, descreva qual modelo matemático apresenta uma solução para retornar a distância média entre os objetos dos dois grupos.

Captura_de tela 2026-04-07 141424.png (292×260)

Fonte: IFSP, 2022.
Alternativas
Q3976945 Algoritmos e Estrutura de Dados
O algoritmo K-NN (K Nearest Neighbor) é um dos algoritmos mais utilizados em Machine Learning, além de ser simples se comparado aos demais. Esse algoritmo é muito utilizado em problemas de classificação, mas pode ser aplicado para regressão. Selecione a opção que NÃO representa uma prática eficiente para preparação dos dados com a aplicação desse algoritmo.
Alternativas
Q3976946 Algoritmos e Estrutura de Dados
A árvore de decisão é um tipo de algoritmo de aprendizagem de máquina supervisionado, que se baseia na ideia de divisão dos dados em grupos homogêneos, e é utilizado para classificação ou regressão. O objetivo da árvore de decisão é encontrar o atributo que gera a melhor divisão dos dados, isto é, para gerar subconjuntos com maior “pureza”. Selecione a alternativa que NÃO apresenta métrica empregada para a definição do melhor atributo para dividir os dados.
Alternativas
Q3976947 Programação
import datetime
d = datetime.datetime(2022,1,2,3,4,5)
print(type(d))
print(d.strftime(“%j”))

Com base no algoritmo, considere as afirmativas:

I –Aprimeira linha realiza a importação do módulo ‘datetime’
II – A segunda linha cria um objeto
III – A terceira linha retorna <class ‘datetime. datetime’>
IV – A última linha imprime o valor 002

Assinale a alternativa correta:
Alternativas
Q3976948 Programação
Uma tarefa muito comum durante a etapa de pré-processamento de dados é o tratamento de valores ausentes. A linguagem Python possui uma biblioteca muito utilizada pelos cientistas de dados, denominada Pandas, que permite realizar o processo de transformação dos dados de maneira bem prática. Considere os dados exibidos pela figura abaixo:

Captura_de tela 2026-04-07 141722.png (699×368)

Fonte: IFSP, 2022.

Pela figura, é possível observar que existem diversos valores ausentes, identificados por NaN. Ao analisar essasinformações, o cientista de dados decide substituir os valores ausentes em cada coluna, da seguinte forma:

Gravidez: substituir NaN pelo valor 0;
Pressão Sanguínea: substituir NaN pela média dos valores da coluna;
Espessura da Pele: substituir NaN pela moda dos valores da coluna;
IMC: substituir NaN pela mediana dos valores da coluna;
Resultado: substituir NaN pelo valor 0.

O cientista de dados armazenou os valores dentro de um dataframe do Pandas, chamado df. Para realizar a substituição dos valores ausentes, ele decide executar o seguinte comando:

df.fillna(value=valores, inplace=True)

Observe que o argumento “value” recebe um dicionário do Python. Esse dicionário contém as instruções para atualizar os valores das colunas, tal como o cientista de dados deseja. Assinale a alternativa correta, que indica o trecho de código relacionado a esse dicionário de dados.
Alternativas
Q3976949 Estatística
Você recebeu um chamado para colaborar no desenvolvimento de um dos módulos do software acadêmico. O referido módulo deve apresentar um gráfico estatístico para simplificar a interpretação dos dados e facilitar a tomada de decisões. Anexo ao chamado, consta um exemplo de uma matriz de dados extraída do Sistema Gerenciador de Banco de Dados oficial da instituição, possuindo dados relacionados à altura, peso, idade, renda familiar e número de reprovações. Assinale a alternativa que representa o tipo de gráfico mais adequado para análise dos referidos dados.
Alternativas
Q3976950 Engenharia de Software
Machine Learning, ou aprendizado de máquina, é um subcampo da inteligência artificial baseada na ideia de que os sistemas podem aprender a identificar padrões e tomar decisões, por meio da análise de dados. De acordo com o tipo de técnica utilizada no processo de aprendizagem, existem vários algoritmos que podem ser aplicados para gerar o modelo de aprendizado. Os parâmetros desse modelo podem ser atualizados por meio de técnicas de otimização. Com base nessas informações, assinale a alternativa correta.
Alternativas
Q3976951 Banco de Dados
select payment_id, case when not exists (select 1 from customer where customer_id=1 limit 1) then 0 else payment_id end as payment from payment; Com base no comando SQL, considere as afirmativas:

I – Trata-se de uma consulta que utiliza duas tabelas;
II – Serão retornadas duas colunas, ambas nomeadas ‘payment_id’;
III – O comando retornará, no máximo, um registro;
IV – O comando contém erro de sintaxe.

Assinale a alternativa correta.
Alternativas
Q3976952 Estatística
Uma amostra é um subconjunto da população em estudo. Ela representa a população maior e é usada para fazer inferências sobre essa população. A amostragem probabilística é uma técnica de amostragem; nela, as amostras são recolhidas em um processo que dá a todos os indivíduos da população as mesmas chances de serem selecionados. Nesse contexto, associe a técnica de amostragem probabilística com o exemplo apresentado e selecione a alternativa mais apropriada.

1 - Amostra aleatória simples
2 - Amostra sistemática
3 - Amostra Estratificada
4 - Amostra por aglomerados

A - Para obter uma amostra de estudantes universitários, o pesquisador precisaria dividir em classes de amostras. Primeiro organizaria a população por semestre de graduação e, então, selecionaria determinado número de representantes de calouros, pessoas que estão no meio do curso e formandos. Isso garantiria que o pesquisador tivesse quantidades adequadas de indivíduos de cada classe na amostra final.
B - Numa população de 1000 pessoas, você gostaria de escolher uma amostra aleatória de 50 pessoas. Primeiro, cada pessoa é numerada de 1 até 1000. Então, você gera uma lista de 50 números aleatórios e os números dessa lista serão os únicos que você incluirá na amostra.
C - Uma população de estudo contém 2000 estudantes do ensino fundamental e o pesquisador quer uma amostra de 100 estudantes. Os estudantes poderiam ser colocados em uma lista e cada 20º estudante seria selecionado para inclusão na amostra. A fim de evitar o viés humano nesse método, o pesquisador deve selecionar o primeiro elemento aleatoriamente.
D - Suponha que a população-alvo em um estudo seja membros de igrejas nos EUA. Não há uma lista de todos os membros de igrejas no país. O pesquisador poderia, nesse caso, criar uma lista de igrejas nos EUA, escolher uma amostra de igrejas e, então, obter listas de membros dessas igrejas.
Alternativas
Q3976953 Programação
A biblioteca Matplotlib é usada para plotagem de gráficos 2D em Python. A função subplot dessa biblioteca é usada para criação de uma figura com subplotagens.

Captura_de tela 2026-04-07 184229.png (887×419)

Considerando a imagem apresentada, assinale a alternativa que representa qual das sequências deveria ser usada na função subplot nas linhas 7 e 13, respectivamente, para geração dos gráficos apresentados ao lado do código.
Alternativas
Q3976954 Programação
A variedade de recursos para a visualização de dados é um dos diferenciais que atraem o interesse sobre a linguagem de programação Python. Para isso, existem diferentes bibliotecas disponíveis na Internet, com destaque a biblioteca Matplotlib. Dentre os inúmeros recursos dessa biblioteca, o método plot disponibiliza recursos para a visualização bidimensional de dados, como o do gráfico a seguir.

Captura_de tela 2026-04-07 184259.png (419×272)

Fonte: IFSP, 2022.

Considerando esse gráfico gerado utilizando programação Python, selecione a opção que possibilita gerá-lo corretamente de acordo com a visualização apresentada nesta imagem. Para isso, considerar que a curva é uma senoide gerada pelo trecho de código a seguir:

import numpy as np
import matplotlib.pyplot as plt
x = np.linspace(-10, 10, 100)
y = np.sin(x)
Alternativas
Q3976955 Algoritmos e Estrutura de Dados
Entre os modelos de aprendizado de máquina mais comuns, estão as árvores de decisão. Elas são métodos de aprendizado de máquinas muito utilizados em tarefas de classificação e regressão. Em problemas de classificação, os modelos em árvore são designados de árvore de decisão. Para resolver um problema de decisão, esse tipo de método utiliza a estratégia de dividir para conquistar. Uma proposta natural é rotular cada conjunto da divisão por sua classe mais frequente e escolher a divisão que tem menores erros. O conceito fundamental nessa proposta é denominado de entropia. Considerando as árvores de decisão, assinale a alternativa que define corretamente o conceito de entropia.
Alternativas
Respostas
21: B
22: C
23: A
24: D
25: B
26: C
27: A
28: D
29: B
30: C
31: D
32: A
33: D
34: C
35: B
36: A
37: C
38: C
39: D
40: B