近年來,大規模人群基因組學研究項目方興未艾,相關成果陸續發布,標志著生命科學產業和精準醫療正式進入基因大數據時代。然而,龐大的基因數據也帶來了前所未有的挑戰,推動互聯網公司紛紛進入市場。大科學、大數據、大合作的時代正在加速到來。未來,基因大數據會給人類帶來什么樣的巨大影響?四天后,第三屆基因組云計算技術開發者大會(GCTA2018)將在深圳國家基因庫一一解答。風云會,大咖談!一個大科學、大數據、大合作的時代正在加速到來。
大規模人群基因組學成果密集發布
圖像來源:
日前,最新一期《Nature》發表了兩項重磅研究,主要關注英國生物銀行的基因數據。該數據集涵蓋了約50萬個體的全基因組遺傳數據、臨床測量和健康記錄,揭示了生物大數據對于精準醫療的極高價值。
《Cell》年10月4日,迄今為止最大規模的中國人基因組學大數據研究成果發布,該成果由華大研究團隊牽頭,歷時兩年,對中國超過14萬人進行無創產前基因檢測數據的深入研究。這也是華大牽頭的“百萬人基因大數據研究”項目的首秀。
放眼全球,近年來,大規模人群基因組學研究項目方興未艾。相關成果陸續發布,標志著生命科學產業從單一樣本的檢測診斷正式進入基因大數據時代;其次,也驗證了基于大人群的精準醫學研究成為一種新的科研模式,對基因組學大數據研究具有開拓性價值。
“超摩爾定律”引爆大數據
生命科學和精準醫學已經進入大數據驅動顛覆性變革的時代,這可以追溯到20世紀末。國際人類基因組計劃啟動,包括中國科學家在內的研究人員歷時13年,耗資30億美元,破解了人類第一份“生命天書”。
在過去的20年里,個體基因組測序的成本以“超級摩爾定律”的速度快速下降。國產測序儀的加入,加速了它的進程。華大基因2016年宣布個人基因組重測序進入百美元時代。未來,標準的數字化成本越來越低將成為不可逆轉的趨勢,這也使得生活大數據呈爆炸式增長。業界甚至認為,在不久的將來,數據存儲的成本將超過測序的成本。
互聯網企業搶灘布局
爆炸式的數據輸出對海量信息的傳輸、存儲、計算和分析提出了新的挑戰。如何及時獲取、分析和存儲這些龐大的數據是研究人員迫切需要解決的問題。大數據的存儲、讀取、理解、寫入、存儲和使用也成為業內人士關注的焦點,并給BT IT行業帶來了新的市場、新的挑戰和新的需求。
早在2015年,國內領先的測序公司華大基因就與阿里云、英特爾合作,共同推出大型生物信息分析平臺BGI在線,免費為用戶提供最新版本基因組分析工具箱GATK4的許可。
近年來,亞馬遜、微軟、騰訊、華為等互聯網公司也紛紛入場布局基因大數據。行業內涌現出很多專注于生物信息分析的企業,如聚道科技、人類與未來、達人基因等。是最好的。此外,基于大數據研究的新興互聯網公司,如微基因,借助直接面向消費者(DTC)的基因檢測,進一步拉近了高端科研與大眾的距離。
一個大科學、大數據、大合作的時代正在加速到來。
原文已被刪除