Uma forma de identificar genes que são significativamente re...
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Tema central: análise diferencial de expressão em RNA-Seq. Em dados de alta vazão, diferenças de sequencing depth e composição das bibliotecas geram vieses que precisam ser corrigidos antes dos testes estatísticos.
Gabarito: A — normalização dos dados de expressão
Por que é a correta? A normalização ajusta as contagens para diferenças entre amostras (tamanho de biblioteca, composição e, parcialmente, efeitos técnicos), evitando falsos aumentos/reduções de expressão. Sem normalização, fold-changes e valores de p ficam enviesados. Métodos consagrados incluem TMM (edgeR), RLE (DESeq2) e upper-quartile. Ex.: duas bibliotecas com 20M vs 40M leituras mostram aparente “duplicação” global; após normalização, a artefactual “diferença” desaparece. Essa é uma exigência metodológica antes do modelo estatístico (NB/voom) em DESeq2/edgeR/limma.
Estratégia de prova: a expressão “antes de qualquer análise diferencial” costuma apontar para normalização, pois é o passo universal e indispensável para tornar amostras comparáveis.
Por que as demais estão incorretas?
B) Usar qPCR: é validação independente pós-análise, não um pré-requisito. Recomendada para confirmar alguns genes após a estatística do RNA-Seq. Ver boas práticas: Conesa et al., Genome Biology 2016.
C) Filtrar genes de baixa expressão: é uma prática útil para aumentar poder e reduzir FDR, mas não corrige vieses entre bibliotecas. Em muitos fluxos, o filtro é aplicado em conjunto ou após estimativas iniciais de dispersão/normalização; isoladamente não substitui a normalização (edgeR/DESeq2).
D) Determinar quais genes serão analisados: RNA-Seq é, por natureza, não direcionado. A seleção de genes de interesse ocorre depois dos testes ou por critérios biológicos, mas não é condição estatística prévia ao teste diferencial.
E) Pesquisar sobre quais genes serão estudados: é etapa de contextualização biológica (discussão/interpretação), não um passo analítico necessário antes da análise diferencial.
Dica prática: veja no pipeline: QC → mapeamento/quantificação → normalização → modelagem estatística (DE) → múltiplos testes → validação/biologia. Lembre-se dos termos-chave “library size”, “composition bias” e “normalization”.
Referências essenciais: Love et al., Genome Biol 2014 (DESeq2); Robinson et al., Bioinformatics 2010 (edgeR); Law et al., Genome Biol 2014 (limma-voom); Conesa et al., Genome Biol 2016 (best practices).
Gostou do comentário? Deixe sua avaliação aqui embaixo!
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo