——習(xí)近平總書(shū)記在致中國(guó)科學(xué)院建院70周年賀信中作出的“兩加快一努力”重要指示要求
——中國(guó)科學(xué)院辦院方針
語(yǔ)音播報(bào)
9月19日,中國(guó)科學(xué)院上海藥物研究所鄭明月課題組在《細(xì)胞-基因組學(xué)》(Cell Genomics)上,發(fā)表了題為Identifying compound-protein interactions with knowledge graph embedding of perturbation transcriptomics的研究論文。該研究提出了基于知識(shí)圖譜的計(jì)算模型PertKGE。這一模型以數(shù)據(jù)驅(qū)動(dòng)的形式在微擾轉(zhuǎn)錄組數(shù)據(jù)中解耦出化合物-蛋白質(zhì)相互作用。
化合物和蛋白質(zhì)是藥物發(fā)現(xiàn)中兩個(gè)基本實(shí)體,而關(guān)于二者相互作用的建模是藥物發(fā)現(xiàn)的基礎(chǔ)。目前,尚無(wú)通用的計(jì)算方法來(lái)預(yù)測(cè)和解釋所有的化合物-蛋白質(zhì)相互作用,但科研人員可以利用不同的生物數(shù)據(jù)并從多種研究視角構(gòu)建化合物-蛋白質(zhì)相互作圖譜。
在藥物發(fā)現(xiàn)領(lǐng)域,微擾轉(zhuǎn)錄組學(xué)連接了藥物發(fā)現(xiàn)中最重要的實(shí)體(化合物)和組學(xué)數(shù)據(jù),提供了化合物微擾受試體后產(chǎn)生的直觀微擾結(jié)果,為解耦化合物-蛋白質(zhì)相互作用(CPI)提供了新視角。然而,由于生物數(shù)據(jù)的噪聲、細(xì)胞穩(wěn)態(tài)及轉(zhuǎn)錄組表達(dá)的動(dòng)態(tài)變化等原因,CPI通常不會(huì)直接反應(yīng)在差異表達(dá)基因上,這為微擾轉(zhuǎn)錄組數(shù)據(jù)的分析帶來(lái)了挑戰(zhàn)。
該研究提出了基于知識(shí)圖譜的PertKGE模型。PertKGE模型受啟發(fā)于微擾組學(xué)分析中的因果推斷模型以及知識(shí)圖譜在藥物發(fā)現(xiàn)中的應(yīng)用,從因果視角來(lái)構(gòu)建新型的生物知識(shí)圖譜,包含原因部分(化合物與受試體中的特定靶標(biāo)發(fā)生CPI)、過(guò)程部分(生物系統(tǒng)中多層級(jí)的調(diào)控事件對(duì)CPI信號(hào)進(jìn)行放大)、結(jié)果部分(微擾結(jié)果以差異表達(dá)基因的形式被觀測(cè))。在此基礎(chǔ)上,研究結(jié)合知識(shí)圖譜嵌入技術(shù)來(lái)建模因果鏈接,以達(dá)到從差異表達(dá)基因中解耦CPI的目的。廣泛的計(jì)算實(shí)驗(yàn)表明,PertKGE在化合物冷啟動(dòng)和靶標(biāo)冷啟動(dòng)場(chǎng)景中均取得了優(yōu)異的CPI預(yù)測(cè)性能,同時(shí),PertKGE通過(guò)因果策略引入的多級(jí)調(diào)控事件緩解了CPI數(shù)據(jù)集中代表性偏差對(duì)模型學(xué)習(xí)的影響,從而提高了預(yù)測(cè)的可靠性。
進(jìn)一步,該研究將PertKGE整合到基于表型和基于靶標(biāo)的藥物發(fā)現(xiàn)流程,發(fā)現(xiàn)了TNKS抑制劑K-756的新靶標(biāo)ENPP1,為獨(dú)特的抗腫瘤免疫效應(yīng)提供了分子層面的機(jī)制解釋。研究以10.8%的高命中率為治療結(jié)直腸癌和胰腺癌的新型靶標(biāo)ALDH1B1篩選到5個(gè)具有全新骨架的苗頭化合物。
該團(tuán)隊(duì)將CPI預(yù)測(cè)任務(wù)對(duì)應(yīng)到藥物發(fā)現(xiàn)的真實(shí)場(chǎng)景中,從計(jì)算模擬和實(shí)驗(yàn)驗(yàn)證兩方面證明了PertKGE在藥物發(fā)現(xiàn)流程中的作用,為CPI圖譜的構(gòu)建和推理提供了全新策略。
研究工作得到國(guó)家自然科學(xué)基金、國(guó)家重點(diǎn)研發(fā)計(jì)劃、中國(guó)科學(xué)院基礎(chǔ)與交叉前沿科研先導(dǎo)專項(xiàng)、中國(guó)科學(xué)院青年創(chuàng)新促進(jìn)會(huì)會(huì)員項(xiàng)目、上海藥物所與上海中醫(yī)藥大學(xué)中醫(yī)藥創(chuàng)新團(tuán)隊(duì)聯(lián)合研究項(xiàng)目、中國(guó)科協(xié)青年托舉人才工程及上海市科技重大專項(xiàng)的資助,并獲得國(guó)家蛋白質(zhì)科學(xué)研究(上海)設(shè)施規(guī)模化蛋白質(zhì)制備系統(tǒng)的技術(shù)支持。
PertKGE工作流
© 1996 - 中國(guó)科學(xué)院 版權(quán)所有 京ICP備05002857號(hào)-1 京公網(wǎng)安備110402500047號(hào) 網(wǎng)站標(biāo)識(shí)碼bm48000002
地址:北京市西城區(qū)三里河路52號(hào) 郵編:100864
電話: 86 10 68597114(總機(jī)) 86 10 68597289(總值班室)
編輯部郵箱:casweb@cashq.ac.cn
© 1996 - 中國(guó)科學(xué)院 版權(quán)所有 京ICP備05002857號(hào)-1 京公網(wǎng)安備110402500047號(hào) 網(wǎng)站標(biāo)識(shí)碼bm48000002
地址:北京市西城區(qū)三里河路52號(hào) 郵編:100864
電話: 86 10 68597114(總機(jī)) 86 10 68597289(總值班室)
編輯部郵箱:casweb@cashq.ac.cn
© 1996 - 中國(guó)科學(xué)院 版權(quán)所有
京ICP備05002857號(hào)-1
京公網(wǎng)安備110402500047號(hào)
網(wǎng)站標(biāo)識(shí)碼bm48000002
地址:北京市西城區(qū)三里河路52號(hào) 郵編:100864
電話:86 10 68597114(總機(jī))
86 10 68597289(總值班室)
編輯部郵箱:casweb@cashq.ac.cn