原理
PacBio单分子实时测序(SMRT)在零模波导孔(ZMW)中观察单个DNA聚合酶合成时的荧光标记dNTP掺入。HiFi模式建立环形SMRTbell文库(两端发卡接头使模板成环),聚合酶反复滚环测序同一分子——多次subread经CCS算法生成高精度consensus。单分子Pass数10-20次时准确率>99.9%(Q30),突破长读长平台的准确性瓶颈。
步骤
1. DNA片段化与损伤修复
取300 ng高分子量病毒DNA,用g-TUBE剪切至目标大小(推荐15-20 kb)。DNA Damage Repair Mix修复缺口和氧化损伤,AMPure磁珠纯化。
2. SMRTbell文库构建
末端修复+A尾后用Blunt/TA Ligase连接SMRTbell Adaptor(发卡结构接头)。ExoIII+ExoVII消化未连接接头的线性DNA。AMPure 0.45×磁珠选择>5 kb分子。
3. 测序引物退火与聚合酶结合
退火测序引物至SMRTbell接头,加Sequel II Polymerase 2.0结合形成模板-聚合酶复合物。上样至Sequel IIe SMRT Cell 8M。
4. CCS数据生成与分析
测序30小时,SMRT Link软件自动执行CCS分析(minPasses=3, minAccuracy=0.99)。输出HiFi reads(BAM/FASTQ),用Canu/Hifiasm做病毒基因组de novo组装。
参数选择建议
| 参数 | 推荐值 | 说明 |
|---|---|---|
| CCS最小Pass数 | 3 | 3次subread即可达Q20,10次达Q30 |
| 片段大小选择 | 15-20 kb | 病毒基因组通常<200> |
| 组装工具 | Canu + Arrow | 长读长病毒基因组assembler首选 |
FAQ
Q:PacBio HiFi和Nanopore长读长怎么选?
A:HiFi单分子准确率>Q30高于Nanopore(Q15-20),但读长较短(15-25 kb vs >100 kb)。病毒基因组<200>200 kb)或结构变异分析选Nanopore。
Q:输入DNA量不足300 ng怎么办?
A:可用低输入建库方案,最低10 ng。但低输入下Exo消化步骤需延长至1小时。也可先做全基因组扩增(WGA)但会引入扩增偏倚和嵌合序列。
Q:CCS和subread哪个更适合病毒组装?
A:病毒溯源必须用CCS reads——subread单次准确率仅~90%,组装后假SNP率极高。CCS总数据量不如subread但准确率飞跃,病毒基因组小故覆盖度足够。
参考文献
- Wenger AM, Peluso P, Rowell WJ, et al. Accurate circular consensus long-read sequencing improves variant detection and assembly of a human genome. Nat Biotechnol. 2019;37(10):1155-1162. DOI: 10.1038/s41587-019-0217-9
- Eid J, Fehr A, Gray J, et al. Real-time DNA sequencing from single polymerase molecules. Science. 2009;323(5910):133-138. DOI: 10.1126/science.1162986
