EN
chi-biotech 近缘物种基因组修正策略


策略背景介绍


  非模式物种的高通量测序项目, 采用De novo组装参考序列,将面临费时费力费钱、组装错误率高,注释困难等系列问题。如果能找到近缘物种基因组并进行修正,是一种省力省钱,且准确可靠的策略。然而传统算法因容错率低,不能修正高差异度的参考序列。FANSe由于其高精准度、高容错能力,在近缘物种基因组修正上表现突出,可以在很大程度上解决非模式物种高通量测序的参考序列问题。



优势


 避免了采用De novo组装参考序列面临的费时费力费钱、组装错误率高,注释困难等系列问题
 近缘物种基因组修正策略,相对省力省钱,且结果准确可靠
 基于FANSe的近缘物种基因组修正,能完美应对高差异度的参考序列


应用方向



案例【临床分离修正基因组】[1]


背景


  临床分离一株短小芽孢杆菌(Bacillus pumilus),与标准模式菌株Bacillus pumilus SAFR-032基因组差异度高达5%。 用Illumina HiSeq-2000测序仪测序其基因组,将reads向标准模式菌株参考基因组进行逐次累进比对,以寻找基因组突变及修正基因组。随机挑选1994个位点,使用毛细管测序(一代测序)方法测定真实的基因组,以检验几种算法检测突变和修正基因组的能力。


结果


  在实验验证的1994个位点中,FANSe 修正基因组的结果无一假阳性、无一假阴性,完美符合真实基因组。而传统算法 Bowtie2 和 Stampy 修正的结果存在大量的假阳性和假阴性,其修正的基因组有许多碱基不符合真实状况,被实验所否定。下图展示了部分实验验证结果,标灰色的碱基为不符合实际的碱基。这一结果显示了FANSe2惊人的准确性和可验证性。






 基因名




 验证区段长度

不符合实验验证的碱基数量(假阴性、假阳性)



原始参考序列



Bowtie2修正



Stampy修正



FANSe修正

BPUM_11_39

360 69(19.2%) 69 16 0

hisC

720 38(5.3%) 38 5 0

yceD

360 40(11.1%) 40 4 0

rpsC

554 2(0.4%) 3 0 0




参考文献


[1] X Wu, L Xu, W Gu, Q Xu, QY He *, X Sun *, G Zhang * Iterative Genome Correction Largely Improves Proteomic Analysis of Nonmodel Organisms. Journal of proteome research (2014), 13 (6), 2724–2734.