在加州大學伯克利分校最近舉行的年度會議上,研究人員展示了他們在加速癌癥基因治療和擴展計算機理論領域方面的進展。
加州大學伯克利分校計算機科學系教授David A. Patterson呼吁業(yè)界聯合使用數百萬個基因庫來促進癌癥治療。
目前,獨立的基因庫只有不到10,000條基因信息,其中許多只是基因的部分片段。
“目前,可以說計算機科學用于建立快速而準確的基因管道并促進個性化治療。
我希望以此來盡快幫助我和我的家人”。
帕特森還透露,目前的研究人員經常在完成實驗后刪除遺傳數據。
計算機科學家大衛(wèi)·帕特森(David Patterson)希望通過海量數據分析方法來克服癌癥基因組問題。
Patterson協助開發(fā)了一個名為SNAP的工具,該工具顯然提供了更快,更準確的遺傳分析,并且也已被癌癥研究人員廣泛使用。
他指出,然而,仍然需要基準測試工具來改善目前在該領域仍然使用的高度主觀的方法。
此外,加州大學正準備斥資6000萬美元建立一所新學院,希望在未來十年內在計算機科學方面取得新的突破。
“我們希望開發(fā)一種新的作戰(zhàn)理論,該理論將遠遠超出當前的研究范圍,并涵蓋其他領域中的問題”。
指導這項工作的理查德·卡普(Richard Karp)說。
他指出,“許多現象可以被視為具有計算特征”,如果我們仔細觀察活細胞的工作方法,我們可以將其想象為一種信息處理。
經濟也是信息處理的活動。
"該校還將在今年5月舉辦一次學術研討會,以聚集各界專家,共同研究新理論的可能性。
使用大量數據治療癌癥Patterson的目標是在開發(fā)Berkeley子校正中使用大量數據工具,以便它可以導入和分析大量遺傳數據以進行癌癥研究。
這些工具包包括Spark& mdash;這是一種用于計算機集群的編程語言,它提供的功能類似于Google搜索引擎使用的Map Reduce。
伯克利數據分析系統是基于Spark的開源引擎。
伯克利實驗室(Berkeley Lab)的科學家使用算法和計算管道來詳細分類大量圖像組合,并找出腫瘤的亞型。
它還可以不同程度地分析腫瘤中包含的異質性或組織結構。
然后,計算管道可以使用臨床數據對細胞特征進行分類,以預測患者的預后。
同時,它還使用大規(guī)?;蚪M數據,通過海量數據分析來確定每種亞型的分子相關性。
研究人員已經開發(fā)出一種可以自動分析大量腫瘤圖像以幫助預測對癌癥治療反應的方法。
箭頭放大了腫瘤圖像的不同區(qū)域。
(資料來源:伯克利實驗室)當前,海量數據研究面臨的挑戰(zhàn)是開發(fā)一種技術,該技術可以及時,經濟高效地解決海量數據問題。
伯克利研究小組正在采取多項行動來應對這一挑戰(zhàn):開發(fā)基于統計機器學習的算法;在云中使用多臺計算機;并開發(fā)籌集資金的技術,以結合人群的力量來幫助回答計算問題。
對于法律和機器來說,這個問題太困難了。
通過這些技術,它將有助于在癌癥治療方面取得突破。
為了實現更快,更經濟高效的基因組數據處理,需要一種可以同時使用云機的新基礎架構。
當癌癥基因的發(fā)現和診斷超過這些算法和機器時,也有必要收集每個人的資源和智慧,共同克服挑戰(zhàn)。