開創(chuàng)“寒武紀(jì)”
來源:中國科學(xué)報(bào) 趙廣立【字號(hào):大 中 小】
回憶起和弟弟陳天石——如今的中科寒武紀(jì)科技股份有限公司(以下簡稱寒武紀(jì)公司)董事長兼總經(jīng)理一起鉆研深度學(xué)習(xí)處理器芯片的歲月,中國科學(xué)院計(jì)算技術(shù)研究所(以下簡稱計(jì)算所)副所長、處理器芯片全國重點(diǎn)實(shí)驗(yàn)室主任陳云霽總結(jié)出四個(gè)字——“有笑有淚”。
一次“流淚事件”讓人忍俊不禁:兄弟倆曾因一篇論文中一句話的表述爭紅了臉,后來爭吵升級(jí),打了一架。
陳云霽已經(jīng)記不起論文中那句話后來到底采納了誰的意見,只記得最后倆人都雙眼噙滿淚花,互相松開了揪著對(duì)方衣領(lǐng)的手。
“親兄弟之間可以放下一切掩飾,坦率面對(duì)各種問題,不用給對(duì)方留任何情面。”陳云霽笑著說,“也許正因?yàn)檫@樣,我倆才得以快速推進(jìn)芯片設(shè)計(jì)和人工智能(AI)算法的交叉研究?!?/p>
陳云霽(右)、陳天石兄弟。
1?“你怎么亂改?”
來自江西南昌的陳云霽、陳天石兄弟,都畢業(yè)于中國科學(xué)技術(shù)大學(xué)(以下簡稱中國科大)少年班,又先后來到計(jì)算所深造。
哥哥陳云霽先一步考入中國科大少年班、踏入計(jì)算所。“我們倆成長軌跡接近,有必然性,也有巧合。”陳云霽笑言,“陳天石對(duì)我從來是不服氣的。覺得‘我們天天玩在一起,你也不比我聰明,你能上少年班,我也能上’,后面的每一步也是一樣?!?/p>
計(jì)算所是兄弟倆“科學(xué)家夢(mèng)”開始的地方。
陳云霽在少年班學(xué)的專業(yè)是計(jì)算機(jī)。當(dāng)他大四那年聽說計(jì)算所在做國產(chǎn)通用處理器(即“龍芯”)時(shí),有過相關(guān)經(jīng)歷的他心里“癢得很”,就想到計(jì)算所讀研。
陳云霽本科時(shí)成績并不好,“既非最聰明也非最刻苦”,但打心底里對(duì)計(jì)算機(jī)感興趣?!褒埿?號(hào)”研制組組長胡偉武注意到這一點(diǎn),力排眾議招他為研究生,把他帶進(jìn)“龍芯”研發(fā)團(tuán)隊(duì)。
陳云霽被分在驗(yàn)證組,主要工作就是編寫測試程序,驗(yàn)證芯片功能是否正確、能不能“跑得通”。
芯片功能驗(yàn)證既繁重又枯燥。在芯片模擬器上驗(yàn)證,速度非常慢,一次操作系統(tǒng)啟動(dòng)就要兩個(gè)星期;發(fā)現(xiàn)了問題還要及時(shí)響應(yīng),和工程師一起查找原因、解決問題。為了提高效率,測試工程師一般同時(shí)測試多個(gè)任務(wù)。但越是這樣,越需要有人一刻不停地在屏幕前盯著,等待“success”最終跳出來。
“既耗人也耗機(jī)器?!标愒旗V說,“點(diǎn)燈熬油、通宵達(dá)旦是常態(tài)。”
“這么機(jī)械的工作,能不能讓機(jī)器替人干?”他想,如果驗(yàn)證、找錯(cuò)的活兒都能自動(dòng)化,那就可以飽飽地睡一覺了。
“懶人”推動(dòng)科技進(jìn)步!說干就干,沒過多久,陳云霽就和同事搭建起了基于AI程序的驗(yàn)證平臺(tái)—— 一個(gè)用AI方法自動(dòng)化生成的驗(yàn)證測試程序。
一開始,驗(yàn)證程序的質(zhì)量參差不齊,有的效率不夠高,有的找錯(cuò)能力不行。這時(shí)候,正在中國科大研究“演化算法”的陳天石送出了關(guān)鍵“助攻”,通過演化算法,他們逐步提高了自動(dòng)生成的測試程序質(zhì)量。
“讀博期間我花了很多時(shí)間做這件事,后來幾個(gè)師弟師妹也加入進(jìn)來。畢業(yè)后不久,胡偉武老師就讓我做‘龍芯’驗(yàn)證組的組長。”陳云霽說。
胡偉武是大忙人,但他仍投身一線編程序?qū)懶酒a,負(fù)責(zé)處理器核里面最復(fù)雜的訪存隊(duì)列模塊。然而,驗(yàn)證組查找出訪存隊(duì)列的問題后,經(jīng)常找不到人。陳云霽等不了也閑不住,就根據(jù)自己的理解,一邊琢磨一邊動(dòng)手修改。
“胡老師的代碼大家都不敢改,一來他寫的是很復(fù)雜的部分,很難懂;二來,改錯(cuò)了怎么辦?”陳云霽記得,胡偉武有次出差回來看到代碼被改了,就質(zhì)問他:“你怎么亂改?都改錯(cuò)了?!比缓笠晃逡皇馗嬖V他每一步代碼的邏輯道理。
次數(shù)多了,陳云霽慢慢能把胡偉武的代碼改對(duì)了。胡偉武見他積極主動(dòng)、干勁十足,在他博士畢業(yè)一年后破格讓他成為“龍芯三號(hào)”主架構(gòu)師中的一員。
2?“別搞這么虛無縹緲的東西了”
成為“龍芯三號(hào)”主架構(gòu)師的陳云霽,知識(shí)結(jié)構(gòu)日益豐富。業(yè)余時(shí)間他又開始琢磨,怎么把AI和芯片設(shè)計(jì)的基礎(chǔ)研究交叉,做一款“聰明的芯片”。
“用智能手段做芯片的驗(yàn)證測試只是填補(bǔ)國內(nèi)空白,我還是想做一些別人從來沒做過的東西?!标愒旗V說。
2010年,陳天石從中國科大博士畢業(yè),加入計(jì)算所擔(dān)任助理研究員。
兄弟重聚,一有空就探討應(yīng)該做什么樣的研究。討論來討論去,最后認(rèn)定有兩件事“非常好玩”,一件是用AI輔助做處理器芯片的設(shè)計(jì),另一件是做AI芯片。
但那時(shí),AlphaGo還沒有擊敗李世石,英偉達(dá)還只是“游戲顯卡”的代名詞,沒有人知道“AI+芯片”會(huì)碰撞出什么樣的火花。
而彼時(shí)國內(nèi)市場上芯片“造不如買”,自主研發(fā)通用CPU芯片不受重視;AI給人的感覺是“遙遙無期”,更不受待見。因此,兄弟二人想要做的“聰明的芯片”,是“冷門中的冷門”。
他們也沒有“上帝視角”。陳天石回憶,剛來計(jì)算所時(shí)他的研究方向是AI,加入的又是“龍芯”處理器團(tuán)隊(duì),當(dāng)時(shí)心里其實(shí)特別忐忑,因?yàn)檫@兩個(gè)方向“在當(dāng)時(shí)看來完全沒關(guān)系”。
“用一塊芯片加速處理幾乎所有的深度學(xué)習(xí)算法程序”的想法,無異于天方夜譚。
他們想不通,學(xué)生們更想不通?!安恢挂粋€(gè)學(xué)生勸我們‘別搞這么虛無縹緲的東西了’,他們跟我說‘陳老師要不您還是帶我們做點(diǎn)不那么非主流的東西吧’。”陳云霽說。
他特別理解學(xué)生們的心情。當(dāng)時(shí),他們這個(gè)課題連20萬元的項(xiàng)目都申請(qǐng)不下來。一名學(xué)生專門做了調(diào)研:國際上完全沒有類似的論文或工作。
“從原始創(chuàng)新的角度看,當(dāng)你做的東西在國際上沒有任何相似的東西時(shí),這是一件讓人感到無比激動(dòng)和興奮的事情。但從功利的角度講,這也意味著干這件事的風(fēng)險(xiǎn)非常大?!标愒旗V頓了一下說,“這可能需要一些理想主義?!?/p>
他后來在一篇文章中回顧了這段歲月,其中有段話是這樣寫的:“在一個(gè)學(xué)術(shù)界不認(rèn)可、工業(yè)界不關(guān)心、難以發(fā)論文、難以申項(xiàng)目的冷門交叉學(xué)科方向孤獨(dú)前行,就像在一片黑暗中摸索,不知道哪里是方向、哪里是出口,甚至不知道有沒有出口?!?/p>
3?“計(jì)算所是做大事的地方”
2010年底,在計(jì)算所內(nèi)的一次匯報(bào)中,兄弟倆向領(lǐng)導(dǎo)報(bào)告了做AI芯片的設(shè)想。
他們不知道該怎么講這天方夜譚般的想法,于是描述了一個(gè)場景:大家很早就在說有一天機(jī)器會(huì)替代人開車,但如果開車的機(jī)器人在做模式識(shí)別的時(shí)候速度不夠快,那就完全沒有讓機(jī)器開的理由——當(dāng)它識(shí)別出前面路上的燈或者行人的時(shí)候,車已經(jīng)撞上去了。所以,它一定要有很強(qiáng)的車載運(yùn)算能力。
沒想到,這個(gè)通俗的比方打動(dòng)了所領(lǐng)導(dǎo),并給出了“你們說得有道理”的評(píng)價(jià)。
這給了兄弟倆繼續(xù)做下去的信心。
2011年,聚焦于前沿技術(shù)探索的“計(jì)算機(jī)體系結(jié)構(gòu)國家重點(diǎn)實(shí)驗(yàn)室”(以下簡稱國重實(shí)驗(yàn)室)依托計(jì)算所成立。在時(shí)任計(jì)算所所長、國重實(shí)驗(yàn)室主任孫凝暉的支持下,國重實(shí)驗(yàn)室圍繞“非傳統(tǒng)體系結(jié)構(gòu)方向”設(shè)立了3個(gè)研究組,智能處理器團(tuán)隊(duì)(現(xiàn)計(jì)算所智能處理器中心)在列。
陳云霽感慨:“在當(dāng)時(shí)的情境下,個(gè)人能堅(jiān)持‘心中的一團(tuán)火花不熄滅’已屬不易,而孫老師愿意從組織上創(chuàng)建一個(gè)新課題組做這樣的研究,就更加難得。”
對(duì)于兄弟倆來說,創(chuàng)立智能處理器團(tuán)隊(duì)的時(shí)機(jī)恰到好處,因?yàn)椤叭绻偻戆肽辏瑩屨忌疃葘W(xué)習(xí)處理器研究的國際學(xué)術(shù)制高點(diǎn)的機(jī)遇,恐怕就錯(cuò)過了”。
陳云霽記得,2013年的一天,孫凝暉把他叫到辦公室,提出由他擔(dān)任智能處理器團(tuán)隊(duì)的課題組負(fù)責(zé)人(PI),專注于智能處理器的基礎(chǔ)研究。
彼時(shí),陳云霽正處于“科學(xué)家和工程師之間的疊加態(tài)”—— 一邊從事通用CPU芯片的工程技術(shù)和產(chǎn)品研制工作,一邊探索智能處理器。顯然,孫凝暉注意到了他這種“難以專注”的狀態(tài)。
“只有專注才能拔尖?!睂O凝暉對(duì)他說,“一個(gè)人不可能同時(shí)做好學(xué)術(shù)研究、技術(shù)開發(fā)、產(chǎn)品研制這幾件事,只能分階段來做?!?/p>
面對(duì)這位年輕的研究員,孫凝暉為30歲的陳云霽做了長遠(yuǎn)打算:“計(jì)算所是做大事的地方,研究員僅僅是做大事的起點(diǎn)。要想在市場、用戶那里占有一席之地,還得有超過別人的創(chuàng)新和優(yōu)勢(shì)?!?/p>
這次深入談話改變了陳云霽的職業(yè)生涯。從那之后,他堅(jiān)定了信念,再也沒有過任何動(dòng)搖。
4?“中文發(fā)音的芯片”
沉下心后,他們用詳盡實(shí)驗(yàn)得出的實(shí)際數(shù)據(jù),扎扎實(shí)實(shí)地證明了深度學(xué)習(xí)處理器的巨大潛力。陳云霽說,他沒想到,這些成果產(chǎn)生了他們不曾想象的學(xué)術(shù)影響力。
2014年是兄弟倆豐收的一年。在2014年3月召開的國際頂級(jí)學(xué)術(shù)會(huì)議ASPLOS上,他們和合作伙伴、計(jì)算所客座研究員Olivier Temam的成果——《DianNao:一種小尺度的高吞吐率機(jī)器學(xué)習(xí)加速器》獲得了最佳論文獎(jiǎng)。這是中國乃至亞洲科研機(jī)構(gòu)首次在計(jì)算機(jī)系統(tǒng)和高性能計(jì)算領(lǐng)域頂級(jí)國際會(huì)議上獲得最佳論文獎(jiǎng)。
陳云霽(左)、陳天石兄弟參加論壇活動(dòng)。
這次獲獎(jiǎng)完全在陳云霽意料之外。ASPLOS的頒獎(jiǎng)宴會(huì),他和Temam一開始沒打算去,因?yàn)椤皼]想過獲獎(jiǎng)這種事跟我們有什么關(guān)系”。當(dāng)獲獎(jiǎng)?wù)呓視詴r(shí),他還在“埋頭苦吃”,根本沒注意臺(tái)上在說什么,直到發(fā)現(xiàn)和他一桌的學(xué)者都停下刀叉,微笑望著他和Temam。
那一刻他突然“蒙了”,走上臺(tái)接過獎(jiǎng)牌時(shí)依然是一臉茫然。他上一次有這種“怎么可能”的震驚心情,還是在高中校運(yùn)會(huì)獲得3000米跑冠軍的時(shí)候。
2014年12月,《DaDianNao:一種機(jī)器學(xué)習(xí)超級(jí)計(jì)算機(jī)》獲處理器架構(gòu)領(lǐng)域另一個(gè)頂尖學(xué)術(shù)會(huì)議MICRO最佳論文——這是MICRO自1963年創(chuàng)辦以來,首次有美國以外國家的學(xué)者獲該獎(jiǎng)項(xiàng)。
一下子拿到兩個(gè)計(jì)算機(jī)體系結(jié)構(gòu)頂會(huì)的最佳論文,兄弟倆才終于意識(shí)到,他們蹚出了一條前人不曾涉足的路。
DianNao和DaDianNao在國際上開創(chuàng)的深度學(xué)習(xí)處理器方向,已經(jīng)成為國際計(jì)算機(jī)體系結(jié)構(gòu)研究的主流。這兩篇論文的他引很快達(dá)到數(shù)千次,施引者遍及全球數(shù)十個(gè)國家、數(shù)百個(gè)科研機(jī)構(gòu)。其中,英偉達(dá)是引用最多的機(jī)構(gòu)之一?!犊茖W(xué)》雜志刊文評(píng)價(jià)這項(xiàng)工作是深度學(xué)習(xí)處理器的“先驅(qū)”和“引領(lǐng)者”。
“DianNao”和“DaDianNao”的名字和發(fā)音曾讓國外同行大費(fèi)周章。一般在國際上發(fā)表研究成果,取名字時(shí)都會(huì)選一個(gè)英語語系里的名字。但兄弟倆反其道而行之,使用中文拼音命名,寓意“電做的大腦”,表達(dá)“AI”之義。參加國際會(huì)議時(shí),他們經(jīng)常要給外國同行糾正發(fā)音,特別是三聲的“腦”,讓許多外國人卷著舌頭重復(fù)了好多遍。
在他們看來,這兩個(gè)名字獨(dú)具魅力,“因?yàn)榇饲皼]有中文發(fā)音的芯片”。
5?“寒武紀(jì)大爆發(fā)”
最佳論文到手后,孫凝暉問兄弟倆:“你們能做出真正的深度學(xué)習(xí)處理器芯片嗎?”
在國重實(shí)驗(yàn)室,有個(gè)不成文的共識(shí)——重視論文,但絕不止于發(fā)表論文,要更重視技術(shù)發(fā)明和原型系統(tǒng),將成果實(shí)際應(yīng)用于產(chǎn)業(yè)。孫凝暉此問,其實(shí)是勉勵(lì)他們做出真正的AI芯片。
事實(shí)上,在2014年5月31日將DaDianNao論文投稿后,陳云霽就帶著一群研究生坐綠皮火車晃蕩著去了成都—— 一邊放松,一邊著手準(zhǔn)備原型芯片的研制。
那幾天,他們晚上在成都的街頭尋訪美食,白天在大學(xué)里找間沒人的教室討論芯片研制問題。
回到北京,在中國科學(xué)院主管部門和計(jì)算所的支持下,課題組全面投入緊張的芯片研制工作。即便已在“龍芯”團(tuán)隊(duì)身經(jīng)百戰(zhàn),作為新PI的陳云霽還是感受到了責(zé)任之重。
在實(shí)驗(yàn)室一間不足30平方米、被戲稱為“小黑屋”的玻璃房里,擠滿了智能處理器團(tuán)隊(duì)的成員,幾乎每張1.5米長的桌子前都要坐兩個(gè)人,擁擠喧鬧、熱火朝天是常態(tài)。2015年,國際上第一顆深度學(xué)習(xí)處理器原型芯片的一次流片成功,就是在這里揭曉的。
陳云霽、陳天石都清晰記得那顆芯片流片回來的晚上——
“我們聚在‘小黑屋’里,把芯片和調(diào)試主機(jī)的串口連通后,調(diào)試主機(jī)屏幕上很快就跳出了深度學(xué)習(xí)測試結(jié)果正確的信息?!?/p>
接下來就是陳云霽的“個(gè)人秀”,他隨手抓起身旁的拖把,即興和學(xué)生們表演了一段“舞槍弄棒”。
初為PI的不安感,在那一刻消散了。
陳云霽說,之所以給芯片取名“寒武紀(jì)”,最初寓意是這個(gè)項(xiàng)目只是一個(gè)基礎(chǔ)性支撐,表明它是一個(gè)非常早期的起點(diǎn)——就如寒武紀(jì)那個(gè)遙遠(yuǎn)而原始的時(shí)代一樣。陳天石也說,寒武紀(jì)芯片想做的是“未來無處不在的AI應(yīng)用的墊腳石”。
他們沒想到,這個(gè)領(lǐng)域的大爆發(fā)來得迅猛且快速。
2016年春,谷歌公司研發(fā)的AlphaGo一戰(zhàn)成名,AI迅速在全世界掀起浪潮。同年,在計(jì)算所和風(fēng)險(xiǎn)投資機(jī)構(gòu)的支持下,寒武紀(jì)公司成立。
2017年,打上“真正的AI手機(jī)”標(biāo)簽的華為Mate10在“寒武紀(jì)芯片”的助攻下取得巨大成功?!昂浼o(jì)1A處理器”也成為首款商用深度學(xué)習(xí)專用處理器。
陳天石展示寒武紀(jì)1A芯片。
寒武紀(jì)1A原型芯片。
2020年7月20日,寒武紀(jì)公司在科創(chuàng)板掛牌上市,上市首日即突破千億元市值。從正式遞交招股書到正式敲鐘上市,寒武紀(jì)公司僅用了116天,成為國內(nèi)AI芯片第一股。
寒武紀(jì)公司在上海證券交易所“敲鐘”,登陸科創(chuàng)板(左一為陳天石)。計(jì)算所供圖
如今將工作重心轉(zhuǎn)向科研管理和基礎(chǔ)研究的陳云霽,已接替孫凝暉,擔(dān)任處理器芯片全國重點(diǎn)實(shí)驗(yàn)室(由計(jì)算機(jī)體系結(jié)構(gòu)國家重點(diǎn)實(shí)驗(yàn)室重組而成)的主任。每當(dāng)路過“小黑屋”看到里面擠滿了熱火朝天工作的同事和學(xué)生時(shí),他的心中仍會(huì)升騰起一股熱流。
“寒武紀(jì)”的初心,始終沒有忘記。
(原載于《中國科學(xué)報(bào)》?2024-09-19?第4版?專題)
(責(zé)任編輯:侯茜)
© 1996 - 中國科學(xué)院 版權(quán)所有 聯(lián)系我們 地址:北京市三里河路52號(hào) 郵編:100864
京ICP備05002857號(hào)-1 京公網(wǎng)安備110402500047號(hào) 網(wǎng)站標(biāo)識(shí)碼bm48000002