Questões de Concurso Público FIOCRUZ 2024 para Tecnologista em Saúde Pública - Bioinformática

Foram encontradas 40 questões

Q3331206 Algoritmos e Estrutura de Dados
Os algoritmos de alinhamento de sequências são essenciais para a análise de sequências biológicas. Esses algoritmos são utilizados em diversas tarefas na Bioinformática, tais como montagem de genomas, análise filogenética e busca por similaridade. Com relação aos algoritmos de alinhamentos, analise as assertivas abaixo.

I. O algoritmo de alinhamento global Needleman-Wunsch consome tempo O(nm), onde n e m são os comprimentos das sequências que serão alinhadas.

II. A matriz de programação dinâmica que o algoritmo Smith-Waterman calcula tem entradas negativas ao alinhar duas sequências de nucleotídeos no sistema de escore que fornece uma penalidade de -5 de abertura de lacuna.

III. O e-value é o valor de probabilidade de encontrar, ao acaso, um hit com um escore maior que o escore calculado do alinhamento.

IV. Dependendo do sistema de pontuação utilizado, o problema de alinhamento múltiplo é NP-hard.

V. O algoritmo de alinhamento semi-global pode ser utilizado para ajudar na montagem de genomas.


Das assertivas acima, apenas: 
Alternativas
Q3331207 Sistemas Operacionais
O Bash é um interpretador de comandos do UNIX. Uma ferramenta disponível no Bash é o pipe, simbolizado por ‘|’. O pipe é utilizado para passar a saída de um comando como entrada para outro comando. Arquivos no formato FASTA são amplamente utilizados na bioinformática. Considerando o uso do pipe, a linha de comando que imprime apenas um único número, indicando quantas sequências o “arquivo. fasta” possui, é:
Alternativas
Q3331208 Programação
Python é uma linguagem de programação amplamente utilizada na Bioinformática. Através do lambda é possível criar funções anônimas. O código que está sintaticamente correto, de acordo com a versão da linguagem Python superior a 3.10, é:
Alternativas
Q3331209 Algoritmos e Estrutura de Dados
Snakemake é um gerenciador de workflows baseado no paradigma do GNU Make. Neste paradigma, define-se um conjunto de regras; cada regra especifica como criar um arquivo de saída a partir de arquivos de entrada. O conjunto dessas regras e as dependências entre elas estabelecem um grafo de dependências entre as tarefas. É correto afirmar que o grafo é:
Alternativas
Q3331210 Programação
Os clusteres de alto desempenho focam em maximizar o desempenho para tarefas computacionais intensivas. Contudo, para se fazer um bom uso dos recursos de um cluster é necessário o conhecimento de modelos de programação paralela como o MPI (Message Passing Interface) e o OpenMP. Nesse contexto, é correto afirmar que: 
Alternativas
Q3331211 Programação
O Biopython é amplamente utlizado para realizar análises na área da Bioinformática. A interface Bio.SeqIO é utlizada para realizar a entrada e saída de arquivos suportando muitos formatos distintos. Considerando o código abaixo, é correto afirmar que:

Imagem associada para resolução da questão
Alternativas
Q3331212 Estatística
A escolha entre usar um teste de hipótese paramétrico ou não paramétrico depende das características dos dados e dos objetivos da análise. Por exemplo, se as suposições para um teste paramétrico são atendidas, prefere-se usar esses testes devido ao seu maior poder estatístico. Em relação aos testes de hipóteses, é INCORRETO afirmar que:
Alternativas
Q3331213 Noções de Informática
A seleção de características (feature selection) é uma etapa importante no contexto de aprendizado de máquina, principalmente quando há diversas dimensões que podem ser exploradas. O conjunto de características (features) selecionadas pode ser efetivamente utilizado para construir modelos preditivos ou realizar outras análises estatísticas. Dentro deste contexto, é correto afirmar que a seleção de característica:
Alternativas
Q3331214 Engenharia de Software
Para avaliar o erro de generalização de um classificador, são empregadas várias técnicas de validação. Uma delas divide o conjunto de teste em k segmentos, utilizando, em cada iteração, um segmento diferente para validação e os demais para treinamento. Outra técnica consiste em treinar o modelo com o conjunto completo, excluindo apenas um elemento, que é então usado para teste, e repetindo este processo para cada um dos elementos. Essas metodologias são reconhecidas na comunidade científica por nomes específicos. Neste contexto, são métodos de validação os abaixo relacionados, EXCETO: 
Alternativas
Q3331215 Banco de Dados
A normalização é um processo crucial no design de bancos de dados, visando organizar tabelas e suas interrelações para reduzir redundâncias e dependências entre os dados. Este processo previne problemas comuns como anomalias de inserção, atualização e exclusão, ao mesmo tempo em que reforça a integridade e consistência dos dados. A normalização se concretiza pela adoção de um conjunto de regras denominadas formas normais, cada uma destinada a resolver questões específicas que podem resultar em ineficiências no armazenamento de dados e na realização de consultas. Neste contexto, é INCORRETO afirmar que:
Alternativas
Q3331216 Biomedicina - Análises Clínicas
O Sequenciamento de Nova Geração (NGS, do inglês “Next-Generation Sequencing”) refere-se a uma família de tecnologias de sequenciamento de DNA e RNA que permitiram avanços significativos na genômica e em áreas relacionadas, como a biologia molecular, a medicina personalizada e a microbiologia. Comparado às técnicas de sequenciamento de primeira geração, como o método de Sanger, o NGS é capaz de sequenciar bilhões de fragmentos de DNA simultaneamente, tornando-o mais rápido e mais barato. Essa capacidade revolucionou a pesquisa genética, possibilitando uma ampla gama de aplicações que vão desde o sequenciamento do genoma completo até a análise de expressão gênica, metagenômica e epigenômica. Em relação a este contexto, a alternativa que possui um conjunto de programas, todos específicos para análise de dados de NGS é:
Alternativas
Q3331217 Biomedicina - Análises Clínicas
Uma forma de identificar genes que são significativamente regulados em diferentes condições, como em tecidos saudáveis versus patológicos, é através da análise diferencial de expressão gênica. A técnica RNA-Seq é a mais utilizada atualmente, sendo capaz de gerar dados de sequenciamento de alta vazão. Após o sequenciamento é importante aplicar métodos estatísticos para discriminar quais genes apresentam mudanças significativas na expressão. Um passo importante que deve ser realizado antes de qualquer análise diferencial de expressão é:
Alternativas
Q3331218 Biologia
Um princípio importante para se realizar a reconstrução filogenética é o princípio da máxima parcimônia. Neste princípio, a árvore filogenética que minimiza a quantidade de mudanças evolutivas é preferida. É correto afirmar que a máxima parcimônia: 
Alternativas
Q3331219 Biomedicina - Análises Clínicas
Um componente importante na anotação de um genoma é a identificação precisa dos genes e sua estrutura no genoma. Os preditores de genes ab initio possuem um papel fundamental nesta etapa. Muitos desses programas utilizam modelos ocultos generalizados de Markov (GHMM – Generalized Hidden Markov Model). Neste contexto, para se utilizar um preditor de genes ab initio é importante:
Alternativas
Q3331220 Saúde Pública
Em estudos de associação genômica ampla (GWAS), é importante identificar polimorfismos de nucleotídeo único (SNPs) associados a fenótipos patológicos ou traços biológicos. PLINK é uma ferramenta de referência para o processamento e análise de dados de genética neste contexto. Dentro do pipeline do PLINK, uma etapa é o procedimento de controle de qualidade, que visa a remoção de SNPs que não atende a determinados parâmetros bioestatísticos. As alternativas abaixo são critérios ou medidas para filtragem de qualidade de SNP em análise GWAS, EXCETO:
Alternativas
Q3331221 Biomedicina - Análises Clínicas
No contexto de biologia sistêmica, as redes de interação proteína-proteína são ferramentas importantes para o entendimento do funcionamento celular. Essas redes podem ser consideradas “redes complexas” e, assim, ser analisadas utilizando ferramentas da teoria de grafos. Nesse contexto, a métrica que é mais relevante para identificar proteínas essenciais para a estabilidade ou a funcionalidade de uma rede de interação é: 
Alternativas
Q3331222 Biomedicina - Análises Clínicas
No contexto da análise de docking molecular, é correto afirmar que a caixa de docking (grid):
Alternativas
Q3331223 Sistemas Operacionais
Em sistemas operacionais, as condições descritas por Coffman são necessárias para que ocorra: 
Alternativas
Q3331224 Algoritmos e Estrutura de Dados
A montagem de genomas complexos representa ainda um dos desafios mais intricados da Bioinformática. As sequências repetidas, em particular, fornecem uma dificuldade notável, pois essas podem confundir algoritmos de montagem, resultando em diversas e múltiplas possibilidades. Para mitigar esse problema e alcançar a montagem correta, a estratégia mais eficaz seria:
Alternativas
Q3331225 Biomedicina - Análises Clínicas
Considerando o genoma de bactérias e o genoma de eucariotos, a diferença típica entre os dois é que bactérias:
Alternativas
Respostas
21: A
22: E
23: B
24: C
25: A
26: D
27: D
28: C
29: E
30: E
31: D
32: A
33: C
34: C
35: D
36: A
37: B
38: A
39: E
40: B