A análise secundária dos dados de NGS incluem:

Próximas questões
Com base no mesmo assunto
Q3331666 Medicina
A análise secundária dos dados de NGS incluem:
Alternativas

Gabarito comentado

Confira o gabarito comentado por um dos nossos professores

Tema central: Etapas da análise de dados de NGS. Em geral, divide-se em: análise primária (basecalling, demultiplexação, QC ➝ saída FASTQ), análise secundária (alinhamento das leituras ao genoma/transcriptoma e chamada de variantes ➝ saídas BAM/CRAM e VCF) e análise terciária (anotação/interpretação, quantificação e testes estatísticos como expressão diferencial).

Alternativa correta (B) – Justificativa: A análise secundária inclui o alinhamento das leituras ao genoma de referência, gerando arquivos BAM/CRAM (leituras mapeadas), e a chamada de variantes, com detecção de SNVs/indels (saída típica em VCF). Esse é o fluxo recomendado por diretrizes técnicas como o GATK Best Practices (Broad Institute) para DNA-Seq, e por workflows do ENCODE/Illumina. Assim, a menção ao alinhamento e à chamada de variantes com armazenamento em BAM caracteriza corretamente a etapa secundária.

Análise das alternativas incorretas:

A) Cita Cufflinks e edgeR. edgeR é usado para expressão diferencial (estatística), e Cufflinks para montagem/quantificação de transcritos. São típicos da análise terciária, não fazem o alinhamento primário (que é feito por BWA, Bowtie2, HISAT2, STAR, etc.).

C) RSEM realiza quantificação de genes/transcritos a partir de BAM (ou pseudoalinhamento), etapa geralmente classificada como terciária em pipelines educacionais. Não contempla chamada de variantes, elemento-chave da análise secundária em DNA-Seq.

D) Descreve o que ocorre na análise primária: processamento no software do instrumento, controle de qualidade (filtragem/trim), e geração de FASTQ com escores Phred. Não é análise secundária.

E) DESeq2 é ferramenta de expressão diferencial (estatística) a partir de contagens; típica de análise terciária, não de alinhamento/variante.

Dica de prova: Associe estágios a formatos: FASTQ → primária; BAM/CRAM (leituras alinhadas) e VCF (variantes) → secundária; contagens/FPKM/TPM e testes (DESeq2/edgeR/Cufflinks/RSEM) → terciária. Ferramentas estatísticas quase nunca são “secundárias”.

Referências úteis: GATK Best Practices (Broad Institute); ENCODE/Illumina DNA/RNA-Seq workflows; Conesa A. et al. A survey of best practices for RNA-seq data analysis. Genome Biology, 2016; UpToDate: Overview of NGS data processing pipelines.

Gabarito: B

Gostou do comentário? Deixe sua avaliação aqui embaixo!

Clique para visualizar este gabarito

Visualize o gabarito desta questão clicando no botão abaixo