原理

PacBio单分子实时测序（SMRT）在零模波导孔（ZMW）中观察单个DNA聚合酶合成时的荧光标记dNTP掺入。HiFi模式建立环形SMRTbell文库（两端发卡接头使模板成环），聚合酶反复滚环测序同一分子——多次subread经CCS算法生成高精度consensus。单分子Pass数10-20次时准确率>99.9%（Q30），突破长读长平台的准确性瓶颈。

步骤

1. DNA片段化与损伤修复

取300 ng高分子量病毒DNA，用g-TUBE剪切至目标大小（推荐15-20 kb）。DNA Damage Repair Mix修复缺口和氧化损伤，AMPure磁珠纯化。

2. SMRTbell文库构建

末端修复+A尾后用Blunt/TA Ligase连接SMRTbell Adaptor（发卡结构接头）。ExoIII+ExoVII消化未连接接头的线性DNA。AMPure 0.45×磁珠选择>5 kb分子。

3. 测序引物退火与聚合酶结合

退火测序引物至SMRTbell接头，加Sequel II Polymerase 2.0结合形成模板-聚合酶复合物。上样至Sequel IIe SMRT Cell 8M。

4. CCS数据生成与分析

测序30小时，SMRT Link软件自动执行CCS分析（minPasses=3, minAccuracy=0.99）。输出HiFi reads（BAM/FASTQ），用Canu/Hifiasm做病毒基因组de novo组装。

参数选择建议

参数	推荐值	说明
CCS最小Pass数	3	3次subread即可达Q20，10次达Q30
片段大小选择	15-20 kb	病毒基因组通常<200>
组装工具	Canu + Arrow	长读长病毒基因组assembler首选

FAQ

Q：PacBio HiFi和Nanopore长读长怎么选？

A：HiFi单分子准确率>Q30高于Nanopore（Q15-20），但读长较短（15-25 kb vs >100 kb）。病毒基因组<200>200 kb）或结构变异分析选Nanopore。

Q：输入DNA量不足300 ng怎么办？

A：可用低输入建库方案，最低10 ng。但低输入下Exo消化步骤需延长至1小时。也可先做全基因组扩增（WGA）但会引入扩增偏倚和嵌合序列。

Q：CCS和subread哪个更适合病毒组装？

A：病毒溯源必须用CCS reads——subread单次准确率仅~90%，组装后假SNP率极高。CCS总数据量不如subread但准确率飞跃，病毒基因组小故覆盖度足够。

参考文献

Wenger AM, Peluso P, Rowell WJ, et al. Accurate circular consensus long-read sequencing improves variant detection and assembly of a human genome. Nat Biotechnol. 2019;37(10):1155-1162. DOI: 10.1038/s41587-019-0217-9
Eid J, Fehr A, Gray J, et al. Real-time DNA sequencing from single polymerase molecules. Science. 2009;323(5910):133-138. DOI: 10.1126/science.1162986

PacBio HiFi测序——高准确度长读长病毒基因组组装方案

原理

步骤