A análise secundária dos dados de NGS incluem:
Gabarito comentado
Confira o gabarito comentado por um dos nossos professores
Tema central: Etapas da análise de dados de NGS. Em geral, divide-se em: análise primária (basecalling, demultiplexação, QC ➝ saída FASTQ), análise secundária (alinhamento das leituras ao genoma/transcriptoma e chamada de variantes ➝ saídas BAM/CRAM e VCF) e análise terciária (anotação/interpretação, quantificação e testes estatísticos como expressão diferencial).
Alternativa correta (B) – Justificativa: A análise secundária inclui o alinhamento das leituras ao genoma de referência, gerando arquivos BAM/CRAM (leituras mapeadas), e a chamada de variantes, com detecção de SNVs/indels (saída típica em VCF). Esse é o fluxo recomendado por diretrizes técnicas como o GATK Best Practices (Broad Institute) para DNA-Seq, e por workflows do ENCODE/Illumina. Assim, a menção ao alinhamento e à chamada de variantes com armazenamento em BAM caracteriza corretamente a etapa secundária.
Análise das alternativas incorretas:
A) Cita Cufflinks e edgeR. edgeR é usado para expressão diferencial (estatística), e Cufflinks para montagem/quantificação de transcritos. São típicos da análise terciária, não fazem o alinhamento primário (que é feito por BWA, Bowtie2, HISAT2, STAR, etc.).
C) RSEM realiza quantificação de genes/transcritos a partir de BAM (ou pseudoalinhamento), etapa geralmente classificada como terciária em pipelines educacionais. Não contempla chamada de variantes, elemento-chave da análise secundária em DNA-Seq.
D) Descreve o que ocorre na análise primária: processamento no software do instrumento, controle de qualidade (filtragem/trim), e geração de FASTQ com escores Phred. Não é análise secundária.
E) DESeq2 é ferramenta de expressão diferencial (estatística) a partir de contagens; típica de análise terciária, não de alinhamento/variante.
Dica de prova: Associe estágios a formatos: FASTQ → primária; BAM/CRAM (leituras alinhadas) e VCF (variantes) → secundária; contagens/FPKM/TPM e testes (DESeq2/edgeR/Cufflinks/RSEM) → terciária. Ferramentas estatísticas quase nunca são “secundárias”.
Referências úteis: GATK Best Practices (Broad Institute); ENCODE/Illumina DNA/RNA-Seq workflows; Conesa A. et al. A survey of best practices for RNA-seq data analysis. Genome Biology, 2016; UpToDate: Overview of NGS data processing pipelines.
Gabarito: B
Gostou do comentário? Deixe sua avaliação aqui embaixo!
Clique para visualizar este gabarito
Visualize o gabarito desta questão clicando no botão abaixo