AI系統(tǒng)可以加速癌癥發(fā)現的搜索
該系統(tǒng)名為LION LBD,由劍橋大學的計算機科學家和癌癥研究人員開發(fā),旨在幫助科學家尋找癌癥相關的發(fā)現。它是第一個旨在支持癌癥研究的基于文獻的發(fā)現系統(tǒng)。結果發(fā)表在生物信息學期刊上。
本文引用地址:http://www.antipu.com.cn/article/201811/395085.htm全球癌癥研究在全球范圍內吸引了大量資金,科學文獻現在如此巨大,以至于研究人員正在努力跟上它:現在,關鍵假設產生的證據在出版后很久就被發(fā)現。
癌癥是一類復雜的疾病,尚未完全了解,是全球第二大死因。癌癥發(fā)展涉及眾多化學和生物化學分子,反應和途徑的變化,并且正在各種科學領域進行癌癥研究,這些領域在描述類似概念的方式上具有可變性。
“作為一名癌癥研究員,即使你知道自己在尋找什么,每天也會有數千篇論文出現,”劍橋語言技術實驗室聯(lián)合主任Anna Korhonen教授說道,他與LION LBD合作領導了這項研究。英國劍橋研究所癌癥研究所的Masashi Narita博士和瑞典卡羅林斯卡醫(yī)學院的Ulla Stenius教授?!癓ION LBD使用人工智能來幫助科學家及時了解他們所在領域的已發(fā)表的發(fā)現,但也可以通過結合可能看似無關的來源之間的聯(lián)系來幫助他們結合文獻中已知的新發(fā)現?!?/p>
LION LBD中的“LBD”代表基于文獻的發(fā)現,這是20世紀80年代開發(fā)的一個概念,旨在通過梳理來自不連續(xù)來源的信息來進行新的發(fā)現。原始版本的LBD背后的關鍵思想是,文獻中從未明確鏈接的概念可能通過中間概念間接聯(lián)系起來。
LION LBD系統(tǒng)的設計允許實時搜索以發(fā)現數千萬個出版物的數據庫中的實體之間的間接關聯(lián),同時保留用戶在其原始上下文中探索每個提及的能力。
“例如,您可能知道某種癌癥藥物會影響某種途徑的行為,但對于LION LBD,您可能會發(fā)現針對完全不同的疾病開發(fā)的藥物會影響相同的途徑,”Korhonen說。
LION LBD是第一個專門針對癌癥研究需求而開發(fā)的系統(tǒng)。它特別關注癌癥的分子生物學,并使用最先進的機器學習和自然語言處理技術,以檢測文本中癌癥標志的參考。對系統(tǒng)的評估已經證明了它能夠識別未發(fā)現的鏈接并在潛在的連接中高度排列相關概念。
該系統(tǒng)使用開放數據,開源和開放標準構建,可作為基于Web的交互式界面或可編程API。
研究人員目前正致力于擴大LION-LBD的范圍,以包括更多的概念和關系。他們還與癌癥研究人員密切合作,為最終用戶提供幫助和改進技術。
該系統(tǒng)是與劍橋大學語言技術實驗室,英國劍橋研究所癌癥研究所和瑞典卡羅林斯卡醫(yī)學院合作開發(fā)的,由醫(yī)學研究委員會資助。
評論