美國西北大學(xué)團(tuán)隊開發(fā)出一種計算工具,能夠從有限的基因表達(dá)數(shù)據(jù)中提取關(guān)鍵信息,識別出多種復(fù)雜疾病背后的多基因組合。這項技術(shù)基于生成式人工智能(AI),為未來的精準(zhǔn)醫(yī)學(xué)和藥物開發(fā)提供了強(qiáng)有力工具。研究論文發(fā)表在最新的《美國國家科學(xué)院院刊》上。
許多疾病是由多種基因共同作用決定的,而不是僅僅一個“壞”基因造成。這種復(fù)雜的基因網(wǎng)絡(luò)使得科學(xué)家難以準(zhǔn)確識別哪些基因組合會導(dǎo)致疾病的發(fā)生。為了應(yīng)對這一挑戰(zhàn),團(tuán)隊開發(fā)了名為TWAVE的新模型。
該模型利用生成式AI技術(shù),模擬健康和患病狀態(tài)下的基因表達(dá)情況,從而將基因活動的變化與表型變化相對應(yīng)。它不僅識別參與疾病發(fā)展的基因群,還使用優(yōu)化算法精確定位最可能引發(fā)細(xì)胞狀態(tài)轉(zhuǎn)變的關(guān)鍵基因變化。
目前,廣泛使用的全基因組關(guān)聯(lián)研究(GWAS)主要尋找與特定性狀相關(guān)的單個基因,但它們?nèi)狈y(tǒng)計能力來檢測多個基因之間的協(xié)同效應(yīng)。TWAVE不依賴于基因序列本身,而是聚焦于基因表達(dá)水平。團(tuán)隊使用臨床試驗數(shù)據(jù)訓(xùn)練模型,使其能識別代表健康或患病狀態(tài)的表達(dá)譜。對于部分基因,他們還結(jié)合實驗數(shù)據(jù),觀察這些基因開啟或關(guān)閉時對整個網(wǎng)絡(luò)的影響,從而更準(zhǔn)確地找到與疾病相關(guān)聯(lián)的基因網(wǎng)絡(luò)。
這種方法具有多重優(yōu)勢。它繞過了基因序列帶來的隱私問題,而且,基因表達(dá)天然包含了環(huán)境因素的影響,模型能間接反映外部因素的作用。
為了驗證TWAVE的實際應(yīng)用效果,團(tuán)隊在幾種復(fù)雜疾病中進(jìn)行了測試。結(jié)果表明,該方法不僅能成功識別已知致病基因,還能發(fā)現(xiàn)一些被現(xiàn)有方法忽略的新基因。更重要的是,它揭示出同一種疾病可能在不同人群中由不同的基因組合引起。這一發(fā)現(xiàn)為未來實現(xiàn)根據(jù)患者個體的遺傳驅(qū)動機(jī)制進(jìn)行個性化治療提供了理論依據(jù)。
【總編輯圈點】
在生命科學(xué)領(lǐng)域,人工智能正在成為破譯復(fù)雜疾病背后基因組合密碼的重要利器。利用傳統(tǒng)方法,科學(xué)家難以破解多基因協(xié)同的致病機(jī)制。而人工智能技術(shù)的優(yōu)點在于,它擅長通過分析海量的基因組數(shù)據(jù)和臨床數(shù)據(jù),挖掘出多基因組合與疾病之間的隱藏關(guān)聯(lián)。此類科研進(jìn)展不僅加深了人類對疾病本質(zhì)的理解,更為疾病的早期診斷、個性化治療提供了有力支撐。這意味著,人工智能正在驅(qū)動精準(zhǔn)醫(yī)學(xué)時代加速到來。
(責(zé)任編輯:華康)