麻省理工學院和其他研究人員開發(fā)的機器學習模型可以識別難以診斷的癌癥。
麻省理工學院和馬薩諸塞州總醫(yī)院 (MGH) 的科赫綜合癌癥研究所 (MGH) 實施了深度學習,以非常具體的方式評估基因,從而為患者找到最佳治療計劃。在早期細胞分化和發(fā)育中發(fā)現(xiàn)的基因表達可能是識別神秘癌癥的關鍵。研究結(jié)果發(fā)表在《癌癥發(fā)現(xiàn)》上。
“有時你可以應用病理學家提供的所有工具,但你仍然沒有答案。像這樣的機器學習工具可以使腫瘤學家選擇更有效的治療方法,并為他們的患者提供更多指導,”該研究的主要作者、MGH 的病理學家和科赫研究所的臨床研究員 Salil Garg 博士說。
當患者第一次被診斷出患有癌癥時,腫瘤學家會試圖查明癌癥的起源。如果臨床醫(yī)生無法確定起點,醫(yī)生會從非靶向治療開始,這通常會導致患者存活率低。
開發(fā)一個機器學習模型來考慮正常細胞和健康細胞之間的差異以及各種癌癥的特征可能具有挑戰(zhàn)性。具有大量癌癥基因表達特征的復雜模型在接收新數(shù)據(jù)時可能會出錯,即使它看起來正在學習新數(shù)據(jù)。模型的過度簡化可能導致癌癥類型的診斷不準確。
Garg 博士和他的團隊縮小了腫瘤細胞發(fā)育途徑改變的跡象。他們使用來自兩個強大的細胞圖譜的數(shù)據(jù)來確定胚胎細胞和癌細胞之間的相關性。小鼠器官發(fā)生細胞圖譜研究了 56 種不同的胚胎細胞軌跡。癌癥基因組圖譜分析了 33 種類型的腫瘤。
然后將相關數(shù)據(jù)用于他們的機器學習模型,稱為發(fā)育多層感知器 (D-MLP),該模型分析腫瘤并預測其起源。該算法用于 52 個新樣本。該平臺能夠?qū)┌Y類型分為四類,這有助于診斷和患者治療計劃。
未來,科學家們計劃使用來自腫瘤成像、顯微鏡和放射學的額外數(shù)據(jù)來進一步增強癌癥患者個性化醫(yī)療治療的預測模型。