RNA_seq
Quantify
Section titled “Quantify”最主流的是 TPM
RPKM 是最早提出的标准化方法:
RPKM = (reads × 10^9) / (gene_length_in_kb × total_mapped_reads)
RPKM 同时校正了基因长度和测序深度的影响,使得不同基因和不同样本间的表达量可以直接比较。
双端测序多测了一遍需要除以 2, 单端不变
FPKM = (fragments × 10^9) / (gene_length_in_kb × total_mapped_reads)
TPM 是目前推荐使用的标准化方法,计算分两步:
- RPK = reads / gene_length_in_kb
- TPM = (RPK × 10^6) / total_RPK
TPM 的优势:
- 每个样本的所有基因 TPM 值总和恒定为 10^6
- 更适合样本间比较,因为标准化顺序更合理
- 先标准化基因长度,再标准化测序深度
Compare Differences
Section titled “Compare Differences”Log2 Fold Change
Section titled “Log2 Fold Change”两个样品中同一个同一个基因表达水平的变化倍数
fold_change = expr_EG / expr_CG
FDR 修正
Section titled “FDR 修正”Example
Section titled “Example”log2FC ≥ 1 && FDR < 0.05 => 上调基因
log2FC ≤ -1 && FDR < 0.05 => 下调基因