——習(xí)近平總書記在致中國科學(xué)院建院70周年賀信中作出的“兩加快一努力”重要指示要求
——中國科學(xué)院辦院方針
語音播報(bào)
菌群標(biāo)志物作為微生物群落在健康與疾病狀態(tài)下的特定生物分子或代謝產(chǎn)物,對(duì)于疾病的早期診斷和預(yù)防具有重要意義。它們揭示了微生物與宿主的互作關(guān)系,并為實(shí)現(xiàn)精準(zhǔn)醫(yī)療和保障公共健康提供了關(guān)鍵的科學(xué)依據(jù)。傳統(tǒng)的生物信息學(xué)方法在識(shí)別菌群標(biāo)志物時(shí)存在預(yù)測準(zhǔn)確性不高和泛化能力不足的問題,而人工智能方法在生物信息學(xué)領(lǐng)域的應(yīng)用和推廣為菌群標(biāo)志物的識(shí)別提供了全新視角。
近日,中國科學(xué)院動(dòng)物研究所趙方慶團(tuán)隊(duì)在《國家科學(xué)評(píng)論》(National Science Review)上發(fā)表了題為Exploring the frontier of microbiome biomarker discovery with artificial intelligence的綜述文章。該論文系統(tǒng)梳理了不同人工智能方法在菌群標(biāo)志物發(fā)現(xiàn)中的應(yīng)用和優(yōu)勢,為人工智能方法在識(shí)別菌群標(biāo)志物的不同應(yīng)用場景中的選擇提供了依據(jù)。同時(shí),該工作探討了當(dāng)前菌群標(biāo)志物研究中人工智能技術(shù)面臨的機(jī)遇與挑戰(zhàn),為領(lǐng)域發(fā)展提供了新的思路和方向。
傳統(tǒng)的菌群標(biāo)志物識(shí)別方法主要依賴于統(tǒng)計(jì)方法如t-test、ANOVA等,對(duì)菌群數(shù)據(jù)進(jìn)行分析并識(shí)別豐度差異的微生物種類或功能基因。由于菌群測序數(shù)據(jù)存在大量噪聲干擾,包括飲食在內(nèi)的生活方式以及實(shí)驗(yàn)條件的變化均可能引入偏差,因此不同數(shù)據(jù)集之間的一致性和測序結(jié)果的準(zhǔn)確性受到影響。同時(shí),菌群數(shù)據(jù)具有稀疏性、高維性和組成性等特征,對(duì)基于菌群豐度的標(biāo)志物識(shí)別和挖掘帶來了挑戰(zhàn)。
為了克服傳統(tǒng)方法的局限性,科研人員探索利用人工智能技術(shù)進(jìn)行菌群標(biāo)志物的挖掘。人工智能方法通過特征選擇和模型訓(xùn)練,能夠識(shí)別出與疾病表型具有顯著關(guān)聯(lián)的菌群特征,挖掘出基于差異豐度分析和共現(xiàn)網(wǎng)絡(luò)分析所無法發(fā)現(xiàn)的潛在模式和復(fù)雜的相互作用,從高維、復(fù)雜的菌群數(shù)據(jù)中識(shí)別出更精確的菌群標(biāo)志物,進(jìn)而提高疾病預(yù)測和診斷的準(zhǔn)確性。同時(shí),一些人工智能模型可以提供可解釋的預(yù)測結(jié)果,幫助研究人員剖析菌群標(biāo)志物與疾病或表型之間的關(guān)系,從而揭示疾病的發(fā)生和發(fā)展機(jī)制。以支持向量機(jī)、隨機(jī)森林和梯度提升決策樹為代表的機(jī)器學(xué)習(xí)算法以及以神經(jīng)網(wǎng)絡(luò)為代表的深度學(xué)習(xí)算法,在較多不同的研究中均表現(xiàn)出優(yōu)異性能。此外,人工智能模型可以整合不同組學(xué)和不同模態(tài)的數(shù)據(jù),通過結(jié)合自然語言處理等技術(shù),進(jìn)一步深度融合不同來源的數(shù)據(jù)信息,從而更全面地探討疾病的發(fā)生和發(fā)展機(jī)制并發(fā)現(xiàn)更精確的菌群標(biāo)志物。
人工智能技術(shù)在菌群標(biāo)志物發(fā)現(xiàn)領(lǐng)域展現(xiàn)出潛力,可以幫助科學(xué)家更好地研究微生物組與疾病之間的關(guān)系,并開發(fā)基于微生物組的診斷和治療策略。上述成果為微生物組相關(guān)疾病的診斷和治療提供了新思路,并為人工智能輔助生物醫(yī)學(xué)研究提供了新見解。
研究工作得到國家重點(diǎn)研發(fā)計(jì)劃、國家自然科學(xué)基金和中國博士后科學(xué)基金的支持。
基于人工智能技術(shù)識(shí)別菌群標(biāo)志物關(guān)鍵策略
© 1996 - 中國科學(xué)院 版權(quán)所有 京ICP備05002857號(hào)-1 京公網(wǎng)安備110402500047號(hào) 網(wǎng)站標(biāo)識(shí)碼bm48000002
地址:北京市西城區(qū)三里河路52號(hào) 郵編:100864
電話: 86 10 68597114(總機(jī)) 86 10 68597289(總值班室)
編輯部郵箱:casweb@cashq.ac.cn
© 1996 - 中國科學(xué)院 版權(quán)所有 京ICP備05002857號(hào)-1 京公網(wǎng)安備110402500047號(hào) 網(wǎng)站標(biāo)識(shí)碼bm48000002
地址:北京市西城區(qū)三里河路52號(hào) 郵編:100864
電話: 86 10 68597114(總機(jī)) 86 10 68597289(總值班室)
編輯部郵箱:casweb@cashq.ac.cn
© 1996 - 中國科學(xué)院 版權(quán)所有
京ICP備05002857號(hào)-1
京公網(wǎng)安備110402500047號(hào)
網(wǎng)站標(biāo)識(shí)碼bm48000002
地址:北京市西城區(qū)三里河路52號(hào) 郵編:100864
電話:86 10 68597114(總機(jī))
86 10 68597289(總值班室)
編輯部郵箱:casweb@cashq.ac.cn