- +1
單位測序成本以“超摩爾定律”速度下降,全球大規模隊列研究恰逢其時?
上世紀末至本世紀初,美、英、日、法、德、中等6國科學家用了13年時間完成第一個人類全基因組圖譜,花費近30億美元。而近20年來,隨著基因測序技術的迭代升級,單位測序成本正以“超摩爾定律”的速度飛速下降。
成本日益親民化之后將帶來何種效應?近日,來自中國、英國、美國以及新加坡等多國研究學者在于南京舉行的一場論壇上由此重點討論了隊列研究中國發展路徑,該論壇由南京醫科大學、全球基因測序儀龍頭因美納(Illumina)等多方舉辦。
與會者在大會中傳遞出一種趨勢:研究人員能夠在有限的預算范圍內對更多的樣本進行測序,并結合生物信息學分析及解讀的進步,正持續驅動著精準醫學領域新見解的快速發現,尤其在腫瘤學、微生物等領域促進了許多新的診斷和預后標志物的研究進展。
實際上,自人類基因組計劃完成以來,以發達國家為代表的全球主要經濟體持續加大對大規模人群隊列研究的投入和支持。與此同時,過去25年間基因測序技術的高速發展以及與大數據科學的交叉應用,使大規模生物信息數據分析研究成為可能。
全球啟動最早的英國生物樣本庫(UKB)即被稱為規模最大、樣本最全、開放程度最高的“典型范本”。該樣本庫共收集了來自50萬名年齡在40到69歲之間的英國人的健康數據,共有約1500萬份生物樣本。換言之,每1000名英國人中就有7人參與其中,且平均每名參與者對應30份樣本。
英國劍橋大學Emanuele Di Angelantonio教授在大會上表示,“UKB集合了來自政府資助、科研機構和產業基金等各方的力量,真正實現了大規模公眾支持、樣本深度分析、數據共享、成功對接醫學研發的研究目標。UKB特有的開放性,為科學家與研究人員提供了獨特的價值——既能提供數據來指導實踐,又能促成新的病因學見解,使得科研‘大數據’被不斷刷新。因此,各種機構能夠廣泛加入,形成合力,使得生物樣本庫可持續‘運轉’,從而充分發揮它的健康影響力。”
中國也是全球最早啟動精準醫學和隊列研究的國家之一。值得一提的是,我國人口基數大,民族多樣性豐富,地區差異明顯,疾病譜復雜,具有開展大規模人群隊列研究的獨特優勢。
而隨著中國隊列研究的發展,當前業內開始更多地關注多學科多中心協作、標準體系統一、生物樣本數據共享等下一階段問題。上述大會提到,以中國慢性病前瞻性隊列(CKB)、泰州隊列、江蘇出生隊列等為代表的大規模人群隊列研究項目均取得了重要進展,這為制定符合我國國情的疾病防控對策提供了新思路與科學依據,也為全球隊列研究提供了“中國樣本”。
中國工程院院士、中國醫學科學院腫瘤醫院林東昕教授即表示,“隊列研究對了解中國特有的疾病成因和防治手段的制定非常重要,以食管癌為例,全世界一半的食管癌患者在中國,我們對于食管癌的研究以及從科研成果轉化而來的食道癌早篩早診技術,其實是位居世界前列的。”其強調,中國人群基礎健康數據庫的建立,對于改善國民健康乃至促進世界范圍內人群主要慢病危險因素及全球病因學研究具有重要意義。
此外,人口老齡化也對人類健康提出了新的挑戰。中國疾病預防控制中心副主任施小明研究員是中國老年健康生物標志物隊列項目的帶頭人,他表示,“當前,我國人口老齡化形勢突出,且老年人口多種慢性病共存比例達75%,為社會和公共服務帶來一系列挑戰。老齡人群健康問題的研究需要深入探究遺傳學機制,我們希望通過對全國代表性隊列和重點地區數據的分析研究,為我國健康老齡化的推進應對提供科學證據。”
值得一提的是,單個人的全基因組序列數據約為90GB(十億字節),一項50萬人的隊列研究僅基因組序列數據就高達約5.6 PB(千兆字節),約等于5億張照片與1.5億小時視頻的數據量。美國國家衛生研究院發布的數據顯示,每年生成的基因組數據量接近400億GB。
然而,獲取這些數據僅僅是解開諸多生命謎團的第一步,測序獲得的海量數據如何處理則是該技術“有效應用”的關鍵。作為設備和技術的提供方,全球巨頭因美納(Illumina)也參與了上述大會。該公司人工智能副總裁、杰出科學家Kyle Farh在大會上提出,“基于人工智能和大模型的算法正在基因數據領域展現巨大潛力,因美納研發團隊正全力推動基于自然選擇訓練的AI算法在基因數據中的應用開發。”
ChatGPT等大模型點燃人工智能新一輪熱潮之際,因美納在今年6月宣布推出全新人工智能(AI)算法——PrimateAI-3D,其能夠利用靈長類動物基因和先進的人工智能技術來改善遺傳風險預測和藥物靶點發現。
因美納方面此前介紹,PrimateAI-3D采用了與ChatGPT和AlphaFold類似的深度神經網絡架構,不同之處在于PrimateAI-3D是根據基因組序列而不是人類語言來進行訓練。“你可以在維基百科和其他地方的現有文本上訓練ChatGPT等生成語言模型,我們使用了類似的深度學習架構,但我們的數據來自數百萬年的自然選擇。”
- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2024 上海東方報業有限公司