Uma forma de identificar genes que são significativamente re...

Próximas questões
Com base no mesmo assunto
Q3331217 Biomedicina - Análises Clínicas
Uma forma de identificar genes que são significativamente regulados em diferentes condições, como em tecidos saudáveis versus patológicos, é através da análise diferencial de expressão gênica. A técnica RNA-Seq é a mais utilizada atualmente, sendo capaz de gerar dados de sequenciamento de alta vazão. Após o sequenciamento é importante aplicar métodos estatísticos para discriminar quais genes apresentam mudanças significativas na expressão. Um passo importante que deve ser realizado antes de qualquer análise diferencial de expressão é:
Alternativas

Gabarito comentado

Confira o gabarito comentado por um dos nossos professores

Tema central: análise diferencial de expressão em RNA-Seq. Em dados de alta vazão, diferenças de sequencing depth e composição das bibliotecas geram vieses que precisam ser corrigidos antes dos testes estatísticos.

Gabarito: A — normalização dos dados de expressão

Por que é a correta? A normalização ajusta as contagens para diferenças entre amostras (tamanho de biblioteca, composição e, parcialmente, efeitos técnicos), evitando falsos aumentos/reduções de expressão. Sem normalização, fold-changes e valores de p ficam enviesados. Métodos consagrados incluem TMM (edgeR), RLE (DESeq2) e upper-quartile. Ex.: duas bibliotecas com 20M vs 40M leituras mostram aparente “duplicação” global; após normalização, a artefactual “diferença” desaparece. Essa é uma exigência metodológica antes do modelo estatístico (NB/voom) em DESeq2/edgeR/limma.

Estratégia de prova: a expressão “antes de qualquer análise diferencial” costuma apontar para normalização, pois é o passo universal e indispensável para tornar amostras comparáveis.

Por que as demais estão incorretas?

B) Usar qPCR: é validação independente pós-análise, não um pré-requisito. Recomendada para confirmar alguns genes após a estatística do RNA-Seq. Ver boas práticas: Conesa et al., Genome Biology 2016.

C) Filtrar genes de baixa expressão: é uma prática útil para aumentar poder e reduzir FDR, mas não corrige vieses entre bibliotecas. Em muitos fluxos, o filtro é aplicado em conjunto ou após estimativas iniciais de dispersão/normalização; isoladamente não substitui a normalização (edgeR/DESeq2).

D) Determinar quais genes serão analisados: RNA-Seq é, por natureza, não direcionado. A seleção de genes de interesse ocorre depois dos testes ou por critérios biológicos, mas não é condição estatística prévia ao teste diferencial.

E) Pesquisar sobre quais genes serão estudados: é etapa de contextualização biológica (discussão/interpretação), não um passo analítico necessário antes da análise diferencial.

Dica prática: veja no pipeline: QC → mapeamento/quantificação → normalização → modelagem estatística (DE) → múltiplos testes → validação/biologia. Lembre-se dos termos-chave “library size”, “composition bias” e “normalization”.

Referências essenciais: Love et al., Genome Biol 2014 (DESeq2); Robinson et al., Bioinformatics 2010 (edgeR); Law et al., Genome Biol 2014 (limma-voom); Conesa et al., Genome Biol 2016 (best practices).

Gostou do comentário? Deixe sua avaliação aqui embaixo!

Clique para visualizar este gabarito

Visualize o gabarito desta questão clicando no botão abaixo