摘要:摘要:隨著二代測序、質(zhì)譜分析、醫(yī)學(xué)影像等生物醫(yī)學(xué)技術(shù)的發(fā)展和應(yīng)用,生物醫(yī)學(xué)數(shù)據(jù)呈現(xiàn)爆炸性增長趨勢,其處理面臨數(shù)據(jù)量大、計(jì)算強(qiáng)度大、維度高等問題。云計(jì)算在資源分配、數(shù)
摘要:隨著二代測序、質(zhì)譜分析、醫(yī)學(xué)影像等生物醫(yī)學(xué)技術(shù)的發(fā)展和應(yīng)用,生物醫(yī)學(xué)數(shù)據(jù)呈現(xiàn)爆炸性增長趨勢,其處理面臨數(shù)據(jù)量大、計(jì)算強(qiáng)度大、維度高等問題。云計(jì)算在資源分配、數(shù)據(jù)存儲(chǔ)、計(jì)算、共享等方面具有優(yōu)勢,能夠幫助解決生物醫(yī)學(xué)大數(shù)據(jù)處理的相關(guān)問題。深入分析了云計(jì)算在生物醫(yī)學(xué)大數(shù)據(jù)處理方面的特點(diǎn),歸納總結(jié)了常見的生物云計(jì)算解決方案,對(duì)生物云計(jì)算的發(fā)展和挑戰(zhàn)進(jìn)行了展望。有望建立能夠整合多源生物醫(yī)學(xué)數(shù)據(jù)的新型計(jì)算方法,以解決復(fù)雜的生物醫(yī)學(xué)問題。
關(guān)鍵詞:生物醫(yī)學(xué)技術(shù);二代測序;醫(yī)學(xué)影像;大數(shù)據(jù);云計(jì)算

1引言
近二十年來生命科學(xué)研究在生物醫(yī)學(xué)技術(shù)的推動(dòng)下得到了快速發(fā)展。特別是高通量測序技術(shù)(或稱為二代測序、下一代測序)憑借其優(yōu)良的測序性能和低廉價(jià)格(每5個(gè)月價(jià)格降一半[1])在領(lǐng)域內(nèi)得到了廣泛應(yīng)用。二代測序同時(shí)衍生出了RNA-seq[2]、ex-ome-seq[3]、ChIP-seq[4]、DNA甲基化測序[5]、染色質(zhì)交互分析[6]等針對(duì)特定生物分子或靶標(biāo)的測序方法。另外,蛋白質(zhì)質(zhì)譜分析法被用于蛋白質(zhì)組學(xué)研究[7],醫(yī)學(xué)影像(如CT、核磁共振MRI)已成為醫(yī)學(xué)研究及診斷的常用技術(shù)。在新型生物技術(shù)的協(xié)助下,大型生物/醫(yī)學(xué)項(xiàng)目(如1000基因組[8]、ENCODE[9]、modEN-CODE[10]、CancerGenomeAtlas[11]、Humanmicrobi-ome[12]等)得以完成或正在穩(wěn)步推進(jìn)。然而,在利用相關(guān)技術(shù)進(jìn)行研究的同時(shí)也產(chǎn)生了規(guī)模龐大的數(shù)據(jù),其累積速度已超過了摩爾定律(Moore’sLaw)所標(biāo)量的計(jì)算機(jī)發(fā)展速度,形成了“生物醫(yī)學(xué)大數(shù)據(jù)”(bio-medicalbigdata)[1]。當(dāng)前,生物醫(yī)學(xué)大數(shù)據(jù)處理的相關(guān)問題已成為生命科學(xué)研究發(fā)展的重要挑戰(zhàn)。
更新了一篇醫(yī)學(xué)相關(guān)的論文,如醫(yī)學(xué)中文核心期刊好投推薦,您可以點(diǎn)擊并前往查看。
2生物醫(yī)學(xué)大數(shù)據(jù)處理與云計(jì)算
由于生物醫(yī)學(xué)研究問題的復(fù)雜性,對(duì)生物醫(yī)學(xué)大數(shù)據(jù)的處理需要借助可靠的算法和高效的計(jì)算平臺(tái),而云計(jì)算恰能為生物醫(yī)學(xué)大數(shù)據(jù)處理提供有力的平臺(tái)支撐。
3生物云解決方案
3.1常見的生物云解決方案
當(dāng)前常見的生物云解決方案如表1所示,主要涉及以下幾方面如圖1所示。
3.2生物云所涉及的云計(jì)算服務(wù)模
型商業(yè)化云計(jì)算主要向用戶提供軟件即服務(wù)(SaaS)、平臺(tái)即服務(wù)(PaaS)和基礎(chǔ)設(shè)施即服務(wù)(IaaS)這3種基本的云計(jì)算服務(wù)模型。同樣地,商業(yè)化生物云在向生物云用戶提供生物醫(yī)學(xué)數(shù)據(jù)處理/軟件開發(fā)的服務(wù)過程中也涉及這3種服務(wù)模型。
4生物云面臨的挑戰(zhàn)
盡管生物云已在領(lǐng)域內(nèi)得到應(yīng)用,但其在資源整合和有效利用方面仍然面臨挑戰(zhàn)。
4.1建立一致的生物云平臺(tái)接口
現(xiàn)有的生物云主要包括商業(yè)化生物云、私有生物云及學(xué)術(shù)生物云這3種類別。其中每種生物云各有不同的機(jī)構(gòu)予以實(shí)現(xiàn),并面向各自的用戶群。在數(shù)據(jù)存儲(chǔ)方面,生物云之間存在著大量的冗余,且交互性不夠好,這使得生物云的資源利用率達(dá)不到最優(yōu)。因此,需要建立一致的生物云平臺(tái)接口,以實(shí)現(xiàn)不同生物云之間的互聯(lián)互訪,使得生物云之間的資源能夠充分共享,進(jìn)而有助于生物醫(yī)學(xué)大數(shù)據(jù)的處理。
4.2生物云的數(shù)據(jù)挖掘
生物云中存儲(chǔ)了來源多樣的生物醫(yī)學(xué)數(shù)據(jù),這些數(shù)據(jù)能夠幫助科學(xué)家揭示豐富的生命奧秘。當(dāng)前的挑戰(zhàn)即在于如何進(jìn)行生物數(shù)據(jù)挖掘,即篩選出合適的數(shù)據(jù)、建立模型,進(jìn)而通過高效的計(jì)算方法獲得生物醫(yī)學(xué)信息。
5結(jié)論
與展望新一代生物醫(yī)學(xué)技術(shù)的廣泛應(yīng)用使生物醫(yī)學(xué)數(shù)據(jù)呈現(xiàn)爆炸性增長的趨勢,生物醫(yī)學(xué)研究由此進(jìn)入大數(shù)據(jù)時(shí)代。相對(duì)于傳統(tǒng)的生物醫(yī)學(xué)數(shù)據(jù)處理環(huán)境,生物云在數(shù)據(jù)存儲(chǔ)、計(jì)算處理、共享等方面具有優(yōu)勢,已經(jīng)開始為生物醫(yī)學(xué)大數(shù)據(jù)處理提供相關(guān)的解決方案,涉及序列比對(duì)、基因組裝配及差異表達(dá)分析等生物信息處理的各個(gè)方面。未來有望建立能夠整合多源生物醫(yī)學(xué)數(shù)據(jù)的新型計(jì)算方法,以解決復(fù)雜的生物醫(yī)學(xué)問題。
參考文獻(xiàn)
[1]STEINLD.Thecaseforcloudcomputingingenomeinformatics[J].GenomeBiol,2010,11(5):207.
[2]MARIONIJC,MASONCE,MANESM,etal.RNA-seq:anassessmentoftechnicalreproducibilityandcomparisonwithgeneexpressionarrays[J].Ge-nomeresearch,2008,18(9):1509-1517.
[3]NGSB,BUCKINGHAMKJ,LEEC,etal.Exomesequencingidentifiesthecauseofamendeliandisorder[J].NatureGenetics,2009,42(1):30-35.
[4]JOHNSONDS,MORTAZAVIA,MYERSRM,etal.Genome-widemappingofinvivoprotein-DNAin-teractions[J].Science,2007,316(5830):1497-1502.
孫磊胡學(xué)龍張曉斌李云