——習(xí)近平總書記在致中國(guó)科學(xué)院建院70周年賀信中作出的“兩加快一努力”重要指示要求
——中國(guó)科學(xué)院辦院方針
語音播報(bào)
“引擎,發(fā)動(dòng)?!痹陔娪啊?012》里,眾人為無法啟動(dòng)汽車著急,一位俄羅斯人只說了一句話就瀟灑地開走了汽車。這樣的場(chǎng)景不再科幻,在日常生活已觸手可及。
“只需要解決好語音識(shí)別和聲紋識(shí)別就能實(shí)現(xiàn)?!苯?,在成都召開的世界未來科技論壇上,清華大學(xué)語音和語言技術(shù)中心主任鄭方表示,語音信號(hào)形簡(jiǎn)意豐,語音技術(shù)構(gòu)筑起的聲音密碼能保障移動(dòng)互聯(lián)“最后一厘米”的安全。該論壇由中國(guó)科學(xué)院、中國(guó)工程院和成都市人民政府聯(lián)合主辦。
移動(dòng)互聯(lián),安全是大問題
信息技術(shù)的發(fā)展給安全識(shí)別帶來了巨大挑戰(zhàn)。以往的識(shí)別技術(shù)出現(xiàn)諸多漏洞。例如,美國(guó)斯坦福大學(xué)最新研發(fā)的一款人臉跟蹤軟件將人臉識(shí)別推到了風(fēng)口浪尖。它可以通過攝像頭捕捉用戶的動(dòng)作和面部表情,然后使用該軟件驅(qū)動(dòng)視頻中的目標(biāo)人物做出一模一樣的動(dòng)作和表情,效果極其逼真。
指紋與虹膜同樣也難逃被攻擊的厄運(yùn)。2016年世界移動(dòng)通信大會(huì)上,《華爾街日?qǐng)?bào)》記者做了一個(gè)實(shí)驗(yàn):他將手指在軟膠模上按壓,待模具成型后,使用一種黏土橡皮泥形成指紋模,iPhone手機(jī)瞬間被指紋膜解鎖。而早在2015年,著名的混沌計(jì)算機(jī)俱樂部安全研究員Jan Starbug在接受采訪時(shí)聲稱,高清晰度圖像就能模擬出人的虹膜。這給生物識(shí)別科學(xué)家?guī)砹撕艽鬀_擊。
在此次論壇上,鄭方援引了《2015中國(guó)電子銀行調(diào)查報(bào)告》數(shù)據(jù):有14.1%的用戶在使用直銷銀行的過程中發(fā)生過個(gè)人信息泄露甚至是資金遺失的情況?!拔磥?,移動(dòng)互聯(lián)網(wǎng)的安全威脅還將向平板電腦、智能電視、iOS設(shè)備等延伸?!?/p>
“解決問題的關(guān)鍵在于人的遠(yuǎn)程身份認(rèn)證?!编嵎綄⑸鲜鰡栴}定義為信息安全的“最后一厘米”,要做的就是解決好人(用戶)機(jī)(智能)之間的一致性。他坦言,目前包括對(duì)安全性要求極高的手機(jī)銀行等在內(nèi)的很多應(yīng)用,其安全手段都還沒有完全解決人機(jī)之間的一致性問題。
聲音具有獨(dú)一無二的優(yōu)勢(shì)
如何才能解決好人機(jī)一致性的問題?鄭方給出的答案是:生物特征識(shí)別。他表示,要證明“我是我”通常有三種手段:一種是根據(jù)“我知道什么”,比如接頭暗號(hào)、取款密碼等;一種是根據(jù)“我有什么”,比如身份證件、IC卡、銀行U盾等;還有一種是根據(jù)“我是誰”,即不憑借任何外界材料,“自己證明自己”。
用自己證明自己,就是所謂的生物特征識(shí)別。生物特征實(shí)際上包含兩大類,大眾熟知的通常是第一類生理特征,比如指紋、人臉、掌紋、虹膜、視網(wǎng)膜,包括DNA。鄭方指出,還有一類是近來才逐步進(jìn)入大眾視野的行為特征,比如聲紋、簽名、步態(tài)、手勢(shì)、鍵盤敲擊等?!斑@些行為特征具有不斷變化的特點(diǎn)?!眱深惿锾卣鞫季哂形ㄒ恍浴?/p>
不過隨著人工智能的飛速發(fā)展,那些被認(rèn)為具有天然優(yōu)勢(shì)的生理特征,由于其外在表現(xiàn)缺少變化反倒越來越成為一種劣勢(shì)?!霸蛟谟谶@些特征容易被模仿。一旦不慎‘遺失’或被非法竊取,就會(huì)一‘丟’百丟?!编嵎皆诮邮堋吨袊?guó)科學(xué)報(bào)》記者采訪時(shí)表示,作為行為特征的聲音信號(hào)具有形簡(jiǎn)意豐的特質(zhì),只要把豐富的語音信息加以綜合利用,比如將語音識(shí)別與聲紋識(shí)別相結(jié)合防止錄音假冒,或是將情感識(shí)別與聲紋識(shí)別相結(jié)合防止被脅迫,就能有效保障移動(dòng)互聯(lián)“最后一厘米”的安全。
鄭方表示,聲音的優(yōu)勢(shì)還在于可借此實(shí)現(xiàn)統(tǒng)一語音平臺(tái),用一句話解決所有問題。他以銀行轉(zhuǎn)賬為例:用戶只需要對(duì)著手機(jī)說:給張三轉(zhuǎn)1000元錢,就能實(shí)現(xiàn)自動(dòng)轉(zhuǎn)款。此時(shí),系統(tǒng)實(shí)際上同時(shí)完成了業(yè)務(wù)識(shí)別、意圖理解及身份認(rèn)證三個(gè)步驟?!皬囊痪湓捓锞湍芴崛〕錾矸?、內(nèi)容、性別、語種、口音、情感等信息,這就是聲音具有的獨(dú)一無二的優(yōu)勢(shì)?!编嵎秸f。
智能語音產(chǎn)業(yè)前景廣闊
幾年前,鄭方在各種場(chǎng)合作報(bào)告介紹語音識(shí)別和聲紋識(shí)別技術(shù)時(shí),鮮有人接受。轉(zhuǎn)眼間,與語音技術(shù)相關(guān)的應(yīng)用已雨后春筍般涌現(xiàn),并形成了從核心技術(shù)研發(fā)到知識(shí)庫提供再到應(yīng)用、服務(wù)的完善產(chǎn)業(yè)鏈。
目前鄭方團(tuán)隊(duì)的研發(fā)成果“聲密?!币言趪?guó)家信息中心投入使用,并預(yù)裝上中國(guó)建設(shè)銀行手機(jī)銀行客戶端,內(nèi)測(cè)的最新版本具備了防錄音、適應(yīng)時(shí)變等能力。此前一年,其團(tuán)隊(duì)研發(fā)的聲紋識(shí)別產(chǎn)品在建行試用,至今零投訴,用戶也呈幾何級(jí)增長(zhǎng)。據(jù)悉,建行將對(duì)聲紋取款、聲紋支付、聲紋轉(zhuǎn)賬等多領(lǐng)域進(jìn)行全面覆蓋。
“21世紀(jì)是語音的世紀(jì)?!编嵎綀?jiān)信,伴隨智能語音技術(shù)的不斷成熟及其與其他信息技術(shù)的不斷融合,智能語音將在更多垂直行業(yè)得到應(yīng)用,并推動(dòng)這些垂直行業(yè)加快向智能化方向發(fā)展。智能家居、智能汽車、可穿戴設(shè)備都將是智能語音重要的應(yīng)用場(chǎng)景。
© 1996 - 中國(guó)科學(xué)院 版權(quán)所有 京ICP備05002857號(hào)-1 京公網(wǎng)安備110402500047號(hào) 網(wǎng)站標(biāo)識(shí)碼bm48000002
地址:北京市西城區(qū)三里河路52號(hào) 郵編:100864
電話: 86 10 68597114(總機(jī)) 86 10 68597289(總值班室)
編輯部郵箱:casweb@cashq.ac.cn
© 1996 - 中國(guó)科學(xué)院 版權(quán)所有 京ICP備05002857號(hào)-1 京公網(wǎng)安備110402500047號(hào) 網(wǎng)站標(biāo)識(shí)碼bm48000002
地址:北京市西城區(qū)三里河路52號(hào) 郵編:100864
電話: 86 10 68597114(總機(jī)) 86 10 68597289(總值班室)
編輯部郵箱:casweb@cashq.ac.cn
© 1996 - 中國(guó)科學(xué)院 版權(quán)所有
京ICP備05002857號(hào)-1
京公網(wǎng)安備110402500047號(hào)
網(wǎng)站標(biāo)識(shí)碼bm48000002
地址:北京市西城區(qū)三里河路52號(hào) 郵編:100864
電話:86 10 68597114(總機(jī))
86 10 68597289(總值班室)
編輯部郵箱:casweb@cashq.ac.cn