語音播報
蛋白激酶(protein kinases)是細胞功能的關鍵調節(jié)分子,是生物體內最大且功能最多樣的基因家族之一。因此,激酶是開發(fā)治療癌癥、炎癥、糖尿病、心血管疾病和阿爾茲海默癥等相關疾病藥物的重要靶標。然而,由于激酶家族蛋白質(特別是催化域)結構的高度保守性,給高效選擇性激酶抑制劑的開發(fā)帶來了巨大挑戰(zhàn)。
二十一世紀以來,隨著計算機計算能力的迅猛提升和大數(shù)據(jù)的涌現(xiàn),深度學習在機器學習算法的基礎上快速崛起,并在藥物研發(fā)領域得到廣泛應用。然而,對許多尚未經(jīng)過充分深入研究的激酶靶標,目前已有的數(shù)據(jù)還遠遠達不到訓練中等規(guī)模神經(jīng)網(wǎng)絡所需的量級。因此,傳統(tǒng)的單任務神經(jīng)網(wǎng)絡模型通常難以取得較好的泛化性能。
為了解決這一問題,中國科學院上海藥物研究所蔣華良、鄭明月團隊采用了多任務深度神經(jīng)網(wǎng)絡(multitask deep neural network)建立分類模型解決化合物的激酶譜預測問題。多任務深度神經(jīng)網(wǎng)絡通過任務間的遷移學習,可以高效解決具有相關性的多類別分類問題,對于眾多激酶靶標,共享的保守催化域使得多重活性預測任務緊密相關。因此,利用多任務深度神經(jīng)網(wǎng)絡可以有效減少特定激酶數(shù)據(jù)不足對模型泛化性能的限制。此外,多任務神經(jīng)網(wǎng)絡只需建立一個模型即可對整體激酶譜進行預測,無需多次建模,并且通過使用共享表示減少了模型參數(shù)的規(guī)模,可以使模型的訓練學習過程更加高效。
上述研究結果近期在線發(fā)表于Journal of Medicinal Chemistry,題為Deep Learning Enhancing Kinome-Wide Polypharmacology Profiling: Model Construction and Experiment Validation,并被選為封面論文。上海藥物所藥物設計與發(fā)現(xiàn)中心(DDDC)鄭明月為論文通訊作者,第一作者是藥物發(fā)現(xiàn)與設計中心博士研究生李敘潼。
基于多任務神經(jīng)網(wǎng)絡的藥物激酶譜預測流程
多任務神經(jīng)網(wǎng)絡與隨機森林預測表現(xiàn)對比
(左)對五個化合物預測與實驗得到的激酶圖譜,標記為紅色的激酶表示預測或實驗測定為活性。(右)預測與實驗得到的激酶家族選擇性,當一個家族的odds ratio顯著大于1(紅色),認為化合物對該激酶家族具有選擇性。
© 1996 - 中國科學院 版權所有 京ICP備05002857號-1 京公網(wǎng)安備110402500047號 網(wǎng)站標識碼bm48000002
地址:北京市西城區(qū)三里河路52號 郵編:100864
電話: 86 10 68597114(總機) 86 10 68597289(總值班室)
編輯部郵箱:casweb@cashq.ac.cn
© 1996 - 中國科學院 版權所有 京ICP備05002857號-1 京公網(wǎng)安備110402500047號 網(wǎng)站標識碼bm48000002
地址:北京市西城區(qū)三里河路52號 郵編:100864
電話: 86 10 68597114(總機) 86 10 68597289(總值班室)
編輯部郵箱:casweb@cashq.ac.cn
© 1996 - 中國科學院 版權所有
京ICP備05002857號-1
京公網(wǎng)安備110402500047號
網(wǎng)站標識碼bm48000002
地址:北京市西城區(qū)三里河路52號 郵編:100864
電話:86 10 68597114(總機)
86 10 68597289(總值班室)
編輯部郵箱:casweb@cashq.ac.cn