在癌癥中,癌細胞會失去控製,它們快速增殖並轉移到身體的其他組織,破壞器官,最終讓人失去生命。這種不受控製的生長通常是由癌基因中的DNA突變累積所致,例如控製細胞發育的這些基因中的突變。但是有些癌癥中只有很少的突變基因,這意味着在這些情況下,還有其他原因導致癌癥的出現一種新的算法可以預測哪些基因會導致癌癥,即使它們的DNA序列沒有改變也是如此。研究團隊結合了多種數據,並使用人工智能(AI)對其進行了分析,成功鑒定出165個新型癌基因。 為個性化醫學中靶向癌癥治療和開發生物標記物開辟了新的前景。
研究團開發了一種基於人工智能(AI)的名為“EMOGI”的新算法,成功識別了165個先前未知的癌基因,這些基因並不一定要發生突變才致癌,有些是通過表達失調致癌。所有這些新發現的癌基因都與已知的著名癌基因有緊密相互作用。而且細胞實驗證實它們對腫瘤細胞的生存至關重要。 研究團隊開發了一款基於圖卷積網絡(GCN)的機器學習算法——EMOGI(Explainable Multiomics Graph Integration)。該算法集成了從患者樣本中生成的數以萬計的數據集,這些數據集包括突變的DNA序列數據、DNA甲基化、單個基因活性以及細胞通路中蛋白質相互作用信息。在這些數據中,深度學習算法可檢測導致癌癥擴展的模式和分子原理。
與傳統的癌癥治療方法(例如化療、放療)不同,個性化治療方法可根據癌癥類型精確調整治療方法和藥物,目的是為每位患者選擇最佳療法,即副作用最少的最有效療法。此外,還能根據患者的分子特征在早期階段識別出癌癥。只有知道了導致疾病的原因,才能夠有效地消滅或糾正它們。這也是為什麼我們要盡可能多的確定誘發癌癥的機製。
到目前為止,大多數癌癥研究都集中在基因序列突變上,實際上,近幾年來的研究表明,表觀遺傳或基因表達失調也可能導致癌癥。
這也是為什麼研究團隊將基因突變序列數據和DNA甲基化、基因表達活性、蛋白相互作用等信息整合整合到一起的原因,首先,研究團隊證實突變或基因組片段的倍增確實是癌癥的主要驅動力。然後,研究團隊進一步找出與癌癥驅動基因不直接相關的候選基因。
蛋白質和基因的相互作用可以映射成一個數學網絡,也就是一個圖形。可以將其想像成一個鐵路網絡。每個站點對應一個蛋白質或基因,它們之間的每個相互作用就像是火車路線。
研究團隊借助人工智能算法,分析了16種不同癌癥類型的成千上萬種不同的相互作用網絡圖。

通過這一算法,研究團隊找到了那些在癌癥中並沒有發生突變的基因,但是它們能夠調控能量供應,因此與癌癥擴展密切相關。這些基因受到甲基化等方式的影響而表達失調,從而影響癌癥擴展。
這些基因是有潛力的癌癥治療靶標,但是由於它們隱藏很深,只有借助生物信息學和嶄新的人工智能算法,才能發現它們。研究團隊還發現,數據中隱藏了許多有趣的細節。我們看到的模式取決於特定的癌癥和組織,研究團隊認為這是腫瘤由不同器官中的不同分子機製觸發的證據。
最後,研究團隊強調,EMOGI算法不僅能夠用於癌癥研究。從理論上講,它可以用來整合各種生物數據集並從中找到模式,因此可用於其他基因發揮重要作用的復雜疾病,例如糖尿病等代謝性疾病等。