Um componente importante na anotação de um genoma é a identi...
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Tema central: Anotação gênica por predição ab initio usa apenas sinais intrínsecos da sequência (p.ex., uso de códons, motivos de sítio de splice, conteúdo GC, distribuição de tamanhos de éxons/íntrons). Muitos preditores modernos empregam Modelos Ocultos de Markov Generalizados (GHMM), que modelam estados como éxon, íntron e regiões intergênicas para prever a estrutura dos genes.
Gabarito: C — Selecionar um programa com modelos específicos para o genoma em análise é crucial. Em GHMMs, os parâmetros (probabilidades de transição/emissão, distribuição de comprimentos, matriz de uso de códons e motivos de doadores/aceitadores) são espécie-específicos. Ajustar o modelo ao organismo eleva sensibilidade e precisão das fronteiras de éxons/íntrons. Ferramentas como AUGUSTUS e GeneMark-ES/ET destacam a importância do treinamento apropriado (Stanke & Morgenstern, Nucleic Acids Res.; Borodovsky & Lomsadze, Curr Opin Biotechnol). Em aplicações biomédicas, isso impacta a interpretação de variantes e painéis diagnósticos.
Por que as demais não são a melhor resposta:
A) Alinhamento de transcritos (RNA-seq/ESTs) é evidência extrínseca. Embora fortaleça a anotação e seja usado em pipelines híbridos (p.ex., MAKER, BRAKER2), não é requisito para usar um preditor ab initio, que, por definição, dispensa dados externos.
B) Alinhamento de proteínas ao genoma também é evidência extrínseca (homologia). Ajuda a localizar regiões codificantes, mas novamente não é inerente ao uso de um método ab initio baseado apenas na sequência alvo.
D) Priorizar “o mais rápido” sacrifica acurácia. Em anotação gênica — especialmente quando o objetivo é aplicação clínica e pesquisa translacional — qualidade do modelo supera velocidade. GHMMs bem treinados tendem a ser mais confiáveis, mesmo com maior custo computacional.
E) Construir um pipeline com múltiplas evidências é ótima prática para anotação final, mas a pergunta foca “para se utilizar um preditor ab initio”. O passo crítico nesse contexto é o modelo espécie-específico (alternativa C). A opção E é ampla e não específica ao requisito de ab initio.
Estratégia de prova: Identifique o termo-chave “ab initio”. Isso indica descartar alternativas que dependem de dados externos (transcritos/proteínas) e valorizar itens sobre parâmetros/treinamento do modelo. Essa é a pegadinha clássica.
Referências sucintas: Stanke & Morgenstern, Nucleic Acids Research (AUGUSTUS); Borodovsky & Lomsadze, Curr Opin Biotechnol (GeneMark); Mount, Bioinformatics: Sequence and Genome Analysis.
Gostou do comentário? Deixe sua avaliação aqui embaixo!
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo