域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過(guò)
基因?qū)W正在改變?nèi)祟惖奈磥?lái),針對(duì)遺傳出生缺陷的產(chǎn)前檢測(cè),腫瘤基因檢測(cè),病毒和細(xì)菌的基因研究等,通過(guò)基因測(cè)序都能找出“元兇”。
所以,基因測(cè)序產(chǎn)業(yè)正迎來(lái)一個(gè)發(fā)展的大時(shí)代,相關(guān)數(shù)據(jù)統(tǒng)計(jì),基因測(cè)序從2007-2013年復(fù)合增長(zhǎng)率為33.53%,全球的市場(chǎng)規(guī)模2007年只有800萬(wàn)美元,而2018年將達(dá)到約117億美元,說(shuō)明基因測(cè)序的市場(chǎng)已經(jīng)逐漸成熟。
如今,基因測(cè)序技術(shù)已被列為國(guó)家重點(diǎn)發(fā)展產(chǎn)業(yè)。據(jù)研究,每年的基因測(cè)序分析增長(zhǎng)會(huì)在30%以上,數(shù)據(jù)量也將是越來(lái)越多,如何傳輸,保存和管理海量的基因數(shù)據(jù)是一個(gè)非常棘手的問(wèn)題所以,HPC正被廣泛應(yīng)用于基因測(cè)序行業(yè)。
年輕的諾禾致源,怎么做到領(lǐng)跑基因測(cè)序行業(yè)
基因測(cè)序行業(yè)是一個(gè)風(fēng)口上的行業(yè),也充斥著大量的新老玩家,但同時(shí)基因測(cè)序又是一個(gè)嚴(yán)謹(jǐn)?shù)男袠I(yè),只有抱著科學(xué)合理的出發(fā)點(diǎn),在不斷試錯(cuò),探索前進(jìn),才能最終勝出。諾禾致源顯然正沿著這樣一條路在前行著。
在國(guó)內(nèi)基因測(cè)序領(lǐng)域,諾禾致源是一個(gè)標(biāo)志性的企業(yè)。作為目前國(guó)內(nèi)基因測(cè)序領(lǐng)域的佼佼者,諾禾致源的業(yè)務(wù)覆蓋科技服務(wù)、腫瘤基因檢測(cè)及遺傳檢測(cè)三大領(lǐng)域,為全球研究型大學(xué)、科研院所、醫(yī)院、醫(yī)藥研發(fā)企業(yè)、農(nóng)業(yè)企業(yè)等提供基因測(cè)序、質(zhì)譜分析和生物信息技術(shù)支持等服務(wù)。
成立于2011年3月的諾禾致源最初以科技服務(wù)為主。2012 年,諾禾致源開(kāi)始拓展腫瘤基因檢測(cè)服務(wù)。發(fā)展至今,諾禾致源業(yè)務(wù)已經(jīng)覆蓋科技服務(wù)、腫瘤基因檢測(cè)及遺傳檢測(cè)三大領(lǐng)域。
實(shí)際上,基因測(cè)序行業(yè)是一個(gè)知識(shí)密集型的產(chǎn)業(yè),衡量的標(biāo)準(zhǔn)有兩個(gè),一是對(duì)基因?qū)W術(shù)的貢獻(xiàn)度,二是先進(jìn)基因測(cè)序儀的擁有量。
那么首先,在基因?qū)W術(shù)的貢獻(xiàn)度方面。截止2018年6月,諾禾致源與項(xiàng)目伙伴合作發(fā)表SCI文章總計(jì)330余篇,累積影響因子大于2120;目前已取得軟件著作權(quán)115項(xiàng),自主研發(fā)專利49項(xiàng)。
其次,目前諾禾致源已在全球運(yùn)行25臺(tái)NovaSeq、20臺(tái)PacBio Sequel、30臺(tái)HiSeq X、11臺(tái)HiSeq 2000/2500/4000、4臺(tái)MiSeq、4臺(tái)NextSeq 500、6臺(tái)Life Ion Proton(DA8600)、2臺(tái)S5XL和5套Q Exactive™ HF-X等最先進(jìn)的基因測(cè)序儀,建立了亞洲通量規(guī)模最大的基因測(cè)序平臺(tái),將實(shí)現(xiàn)每年280,000人全基因組測(cè)序的超高通量。同時(shí),全國(guó)首家引入Q Exactive™ HF-X高端質(zhì)譜平臺(tái),打造最先進(jìn)的生物質(zhì)譜中心,為客戶提供全面、深入的多組學(xué)解決方案。
除了這兩個(gè)關(guān)鍵點(diǎn)之外,諾禾致源的生態(tài)建設(shè)也已非常完善,合作伙伴遍布全球,包括超過(guò)1920家科研院所和高校、720余家醫(yī)院、1430余家醫(yī)藥和農(nóng)業(yè)企業(yè)等。諾禾致源的企業(yè)夢(mèng)想是成為全球領(lǐng)先的基因組學(xué)產(chǎn)品和服務(wù)提供者。
算法和數(shù)據(jù)之后,計(jì)算的三大瓶頸如何打破?
基因測(cè)序最核心的資產(chǎn)就是基因測(cè)序儀產(chǎn)生的龐大數(shù)據(jù)量,所以隨著基因測(cè)序的通量越來(lái)越大,行業(yè)產(chǎn)出的數(shù)據(jù)也越來(lái)越多,相對(duì)而言對(duì)存儲(chǔ)、計(jì)算平臺(tái)的能力也提出更高要求。
所謂高通量基因測(cè)序,是通過(guò)測(cè)序技術(shù)解析生物DNA分析排序特征,包括序列圖譜構(gòu)建,序列比對(duì),變異檢測(cè)等高性能計(jì)算。尤其在人類健康研究中,需要了解海量蛋白質(zhì)的結(jié)構(gòu),功能,相互作用以及與各種人類疾病之間的關(guān)系,尋求各種治療和預(yù)防方法,包括藥物治療?;谏锎蠓肿咏Y(jié)構(gòu)及小分子結(jié)構(gòu)的藥物設(shè)計(jì)等等。
所以在生物信息學(xué)的處理過(guò)程中會(huì)用到大量的軟件,例如面向序列組裝的SOAPDenovo,ALLPATHS-LG,F(xiàn)alcon, Trinity等;面向序列對(duì)比:BWA, Blast, bowtie2等;面向序列分析: CLUSTAL,HMMER等;面向進(jìn)化樹(shù)分析:PHYLIP,TreeBest, MrBayes等。
同時(shí)生物算法正逐漸成熟,生物數(shù)據(jù)通量也急劇提升,這必然會(huì)帶來(lái)對(duì)分析軟件和流程的全面優(yōu)化,所以計(jì)算力成為了精準(zhǔn)醫(yī)療行業(yè)面臨的最大瓶頸。對(duì)諾禾致源來(lái)說(shuō),對(duì)HPC的需求也遇到很多挑戰(zhàn)。
第一,數(shù)據(jù)量巨大。正因?yàn)榛驕y(cè)序儀產(chǎn)生的數(shù)據(jù)量是非常巨大的,這就要求在HPC系統(tǒng)中必須配置海量存儲(chǔ),滿足測(cè)序數(shù)據(jù)的存放。
第二,內(nèi)存的需求大。在序列對(duì)比或者拼接階段,需要一次性將海量數(shù)據(jù)載入到內(nèi)存中并且加以處理,如果內(nèi)存不夠或者性能不優(yōu),很可能無(wú)法進(jìn)行對(duì)比或者下一步的計(jì)算等工作,因此,我們建議對(duì)于生物信息學(xué)應(yīng)用環(huán)境,需要配置胖節(jié)點(diǎn)或者大內(nèi)存節(jié)點(diǎn),滿足數(shù)據(jù)載入和分析,充分提高工作效率。
第三,計(jì)算量大。對(duì)于不同生物信息學(xué)程序而言,基于不同算法的對(duì)于CPU的要求也不盡相同,但是總體計(jì)算量都十分巨大,有的支持并行,有的軟件在單節(jié)點(diǎn)內(nèi)進(jìn)行計(jì)算,總而言之,與其他高性能計(jì)算應(yīng)用相似,生物信息學(xué)類的計(jì)算也為CPU密集型的。
很明顯,如果有HPC的長(zhǎng)期穩(wěn)定的支持,將會(huì)助力諾禾致源對(duì)未來(lái)的發(fā)展,在多方考察之后,諾禾致源選擇了聯(lián)想HPC成為服務(wù)商。聯(lián)想是如何滿足諾禾致源的需求的呢?
用H PC 筑底, 諾禾致源 背后的聯(lián)想之力
聯(lián)想作為國(guó)內(nèi)HPC的領(lǐng)軍者,首先對(duì)諾禾致源的問(wèn)題做了縝密的需求分析。聯(lián)想認(rèn)為:生物信息學(xué)類計(jì)算的核心內(nèi)容是內(nèi)存密集型,存儲(chǔ)密集型,結(jié)合聯(lián)想多年來(lái)的經(jīng)驗(yàn),為諾禾致源提供了針對(duì)化專業(yè)化的解決方案。
主要解決諾禾致源對(duì)高性能、內(nèi)存、存儲(chǔ)和穩(wěn)定性的四大問(wèn)題。
首先,對(duì)于高性能計(jì)算而言,一方面是浮點(diǎn)處理性能,另一方面為CPU本身的綜合性能,聯(lián)想結(jié)合生物信息學(xué)行業(yè)的特點(diǎn),推薦使用Intel處理器,不僅實(shí)現(xiàn)了較高的處理性能,并且在能效比,內(nèi)存支持,以及CPU本身的架構(gòu)上Intel都有很大的優(yōu)勢(shì)。
其次,在生物信息學(xué)應(yīng)用中,先期數(shù)據(jù)的載入對(duì)于內(nèi)存容量的要求越來(lái)越高,聯(lián)想采用大內(nèi)存服務(wù)器四路或者八路胖節(jié)點(diǎn),可以在單節(jié)點(diǎn)中配置最高達(dá)2TB內(nèi)存,充分達(dá)到應(yīng)用的實(shí)際需求。
其三,海量存儲(chǔ)系統(tǒng)是生物信息學(xué)計(jì)算的先決條件。聯(lián)想不僅可以提供了專業(yè)級(jí)的直連存儲(chǔ),更有通過(guò)專有的存儲(chǔ)節(jié)點(diǎn)構(gòu)建并行文件系統(tǒng)或者是分布式存儲(chǔ)系統(tǒng),接入以太網(wǎng),甚至40GB/56GB的Infiniband網(wǎng)絡(luò),總體容量可達(dá)到PB級(jí),除此之外還考慮到用戶的數(shù)據(jù)安全,數(shù)據(jù)備份等,從根本上解決了生物信息學(xué)的數(shù)據(jù)存儲(chǔ)難題。
最后,一套高穩(wěn)定性的系統(tǒng)能夠使我們的生物信息學(xué)應(yīng)用更加方便快捷,同時(shí)也能夠高效率的處理數(shù)據(jù),保證業(yè)務(wù)不中斷,聯(lián)想通過(guò)統(tǒng)一的集群監(jiān)控管理,作業(yè)調(diào)度,結(jié)合聯(lián)想高性能的服務(wù)器,從各個(gè)方面保證了整套系統(tǒng)的穩(wěn)定性,大大提高了用戶的使用穩(wěn)定性和減少了故障率,為用戶提高生產(chǎn)力提供持續(xù)不間斷的支持。
據(jù)了解,聯(lián)想提供的高性能運(yùn)算系統(tǒng),提供了將近200萬(wàn)億次計(jì)算能力,配置超過(guò)10PB的存儲(chǔ)空間。本套集群很好的承載了諾禾致源華東地區(qū)的業(yè)務(wù),有效的改善公司在華東計(jì)算資源不夠的限制。
如今諾禾致源已經(jīng)擁有全球領(lǐng)先的高性能計(jì)算平臺(tái),數(shù)據(jù)中心運(yùn)算能力已提升至1727T flops,總內(nèi)存410TB,總存儲(chǔ)60.2PB,有效地支撐著生命科學(xué)研究和醫(yī)療健康兩大領(lǐng)域?qū)Υ髷?shù)據(jù)分析和存儲(chǔ)的需求。在通過(guò)高性能計(jì)算探索基因?qū)W的未來(lái)之路上,聯(lián)想HPC始終是諾禾致源最值得信任的技術(shù)服務(wù)商。
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!