Skip to content

RNA_seq

最主流的是 TPM

RPKM 是最早提出的标准化方法:

RPKM = (reads × 10^9) / (gene_length_in_kb × total_mapped_reads)

RPKM 同时校正了基因长度和测序深度的影响,使得不同基因和不同样本间的表达量可以直接比较。

双端测序多测了一遍需要除以 2, 单端不变

FPKM = (fragments × 10^9) / (gene_length_in_kb × total_mapped_reads)

TPM 是目前推荐使用的标准化方法,计算分两步:

  1. RPK = reads / gene_length_in_kb
  2. TPM = (RPK × 10^6) / total_RPK

TPM 的优势:

  • 每个样本的所有基因 TPM 值总和恒定为 10^6
  • 更适合样本间比较,因为标准化顺序更合理
  • 先标准化基因长度,再标准化测序深度

两个样品中同一个同一个基因表达水平的变化倍数

fold_change = expr_EG / expr_CG

log2FC ≥ 1 && FDR < 0.05 => 上调基因

log2FC ≤ -1 && FDR < 0.05 => 下调基因