——習(xí)近平總書記在致中國科學(xué)院建院70周年賀信中作出的“兩加快一努力”重要指示要求
——中國科學(xué)院辦院方針
語音播報(bào)
基于中國科學(xué)院聲學(xué)研究所研發(fā)的語音識別核心技術(shù),中國電信集團(tuán)近日在寧夏、新疆、貴州、河北、黑龍江、重慶六個(gè)分公司上線智能客服語音導(dǎo)航系統(tǒng)。
2018年11月,聲學(xué)所中標(biāo)中國電信智能客服云平臺項(xiàng)目,助力建設(shè)智能客服語音能力平臺,提供開放的語音識別和語音合成技術(shù),并在現(xiàn)有各種支撐系統(tǒng)基礎(chǔ)上,支持建設(shè)中國電信“智能客服系統(tǒng)”,提高10000號智慧化客戶服務(wù)水平。
針對實(shí)時(shí)語音識別的需求,聲學(xué)所研究人員提出一種基于混合神經(jīng)網(wǎng)絡(luò)(延時(shí)神經(jīng)網(wǎng)絡(luò)+輸出投影門循環(huán)單元)的低延時(shí)聲學(xué)建模技術(shù),可處理長時(shí)信息,網(wǎng)絡(luò)結(jié)構(gòu)簡潔,計(jì)算速度快,易于并行化訓(xùn)練。該模型結(jié)構(gòu)已作為一種新型的回饋神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)被國際主流語音識別開源軟件Kaldi采納。在非實(shí)時(shí)語音識別方面,研究人員提出基于BLSTM-E(雙向長短時(shí)記憶擴(kuò)展)的深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),提升了現(xiàn)有主流BLSTM性能,解決了序列化訓(xùn)練條件下LSTM對不同長度語音輸入的魯棒性差問題。
在智能語音能力系統(tǒng)上線前,聲學(xué)所針對中國電信線上語音特點(diǎn),進(jìn)行了語音檢測等模塊定制優(yōu)化,并利用多省用戶語音和業(yè)務(wù)知識,開展聲學(xué)模型和語言模型自適應(yīng)優(yōu)化訓(xùn)練,進(jìn)一步提升了系統(tǒng)識別性能水平。此外,聲學(xué)所還提供了語言模型優(yōu)化訓(xùn)練系統(tǒng)和熱詞優(yōu)化系統(tǒng),支持現(xiàn)場模型訓(xùn)練,可實(shí)現(xiàn)新業(yè)務(wù)快速上線。
該系統(tǒng)有效解決了傳統(tǒng)IVR系統(tǒng)菜單復(fù)雜、層級過深的問題,以自然人機(jī)語音交互方式替代原有按鍵式交互流程,實(shí)現(xiàn)菜單扁平化,支持業(yè)務(wù)節(jié)點(diǎn)層級之間的任意跳轉(zhuǎn)、智能中斷和快速返回,簡化了人機(jī)交互流程,為用戶帶來良好體驗(yàn)。
聲學(xué)所和中國電信集團(tuán)預(yù)計(jì)將在2019年上半年完成23個(gè)省市的智能語音導(dǎo)航系統(tǒng)建設(shè)。
© 1996 - 中國科學(xué)院 版權(quán)所有 京ICP備05002857號-1 京公網(wǎng)安備110402500047號 網(wǎng)站標(biāo)識碼bm48000002
地址:北京市西城區(qū)三里河路52號 郵編:100864
電話: 86 10 68597114(總機(jī)) 86 10 68597289(總值班室)
編輯部郵箱:casweb@cashq.ac.cn
© 1996 - 中國科學(xué)院 版權(quán)所有 京ICP備05002857號-1 京公網(wǎng)安備110402500047號 網(wǎng)站標(biāo)識碼bm48000002
地址:北京市西城區(qū)三里河路52號 郵編:100864
電話: 86 10 68597114(總機(jī)) 86 10 68597289(總值班室)
編輯部郵箱:casweb@cashq.ac.cn
© 1996 - 中國科學(xué)院 版權(quán)所有
京ICP備05002857號-1
京公網(wǎng)安備110402500047號
網(wǎng)站標(biāo)識碼bm48000002
地址:北京市西城區(qū)三里河路52號 郵編:100864
電話:86 10 68597114(總機(jī))
86 10 68597289(總值班室)
編輯部郵箱:casweb@cashq.ac.cn