EN
NEWS 媒体报道

 本文转自基因谷

 2018年伊始,深圳承启生物云计算平台搭载自主研发的大规模测序基础算法FANSe3,首次实现单节点1小时完成一个人的全基因组测序分析,再次大幅刷新几个星期前腾讯云的2.8小时的世界记录。

 不同于腾讯云使用专用芯片的FPGA技术,深圳承启生物科技有限公司使用纯CPU方案,没有使用任何硬件加速特性,因此在成本、灵活性和通用性方面优势更为明显,不仅能运行于公司的私有云平台,也能轻松地利用国家耗费巨资建立的大科学设施。承启生物已和天河二号超算达成战略合作,其分析能力是目前地球上所有测序仪测序能力总和的一万倍以上。这意味着在可见的将来,再多的基因组大数据都能在承启生物的云平台上不费吹灰之力地进行分析,这将全面引爆基因测序数据分析在科研/临床方面的精准应用。

 为何承启生物的纯CPU方案居然能大幅超越专用的FPGA?核心在于完全自主研发的大规模测序基础算法FANSe3算法。FANSe3算法是FANSe系列算法的第三代,是承启生物专为云计算平台所开发的,不仅速度快,而且其准确率极高,是目前世界上唯一的准确率有数学证明的同类算法,错误率已可稳定在十亿分之一以下。

 大量实验验证表明,FANSe系列算法在基因组突变分析、转录组表达分析等应用上,准确度几乎为100%,秒杀国外基于BWA、Bowtie等算法的方案,并在医学科研和临床应用中分析了超过50万例样本。在临床实践中,云平台分析测序数据找罕见感染疾病病因、为晚期癌症病人找到合适的靶向药,结果都是立等可取,已挽救了许多人的生命。

 正是有着这样的能力, FANSe系列算法的开发者张弓教授被邀请做TED演讲。  

 此外, FANSe系列算法的优异性能也击败国际上其他的算法,2014年成为国际人类蛋白质组计划核心支柱的首选分析算法,为全面解析人类蛋白质组做出了关键贡献。在2017年9月于爱尔兰召开的国际人类蛋白质组计划世界大会上,以张弓教授等为代表的广东科学家团队发布突破性成果,利用FANSe系列算法,发现数千个以往被认为不可能存在的人类“新蛋白质”,可能成为攻克癌症的关键。 

事实上,2017年11月,承启生物就已经在国际核酸科研领域的顶级期刊、英国《核酸研究》杂志上发表论文,使用FANSe3算法,在公司自己构建的私有云上成功实现了人类全转录组的秒级分析,即在平均1秒多的时间内分析完成一个人类全转录组测序数据,并向全世界科研人员免费开放,创下了测序分析的新世界纪录。

 现在,他们继续成功实现了单节点1小时人类全基因组分析,树立了业界的标杆,也预示着将来大规模测序的分析将不再是瓶颈,精准医学将在不远的将来以极低的成本惠及万家。

基因谷原文报道:http://www.genegood.com/a/view/1735.html