開創(chuàng)“寒武紀”
回憶起和弟弟陳天石——如今的中科寒武紀科技股份有限公司(以下簡稱寒武紀公司)董事長兼總經(jīng)理一起鉆研深度學習處理器芯片的歲月,中國科學院計算技術(shù)研究所(以下簡稱計算所)副所長、處理器芯片全國重點實驗室主任陳云霽總結(jié)出四個字——“有笑有淚”。
一次“流淚事件”讓人忍俊不禁:兄弟倆曾因一篇論文中一句話的表述爭紅了臉,后來爭吵升級,打了一架。
陳云霽已經(jīng)記不起論文中那句話后來到底采納了誰的意見,只記得最后倆人都雙眼噙滿淚花,互相松開了揪著對方衣領(lǐng)的手。
“親兄弟之間可以放下一切掩飾,坦率面對各種問題,不用給對方留任何情面?!标愒旗V笑著說,“也許正因為這樣,我倆才得以快速推進芯片設(shè)計和人工智能(AI)算法的交叉研究?!?/p>
陳云霽(右)、陳天石兄弟。
1?“你怎么亂改?”
來自江西南昌的陳云霽、陳天石兄弟,都畢業(yè)于中國科學技術(shù)大學(以下簡稱中國科大)少年班,又先后來到計算所深造。
哥哥陳云霽先一步考入中國科大少年班、踏入計算所?!拔覀儌z成長軌跡接近,有必然性,也有巧合?!标愒旗V笑言,“陳天石對我從來是不服氣的。覺得‘我們天天玩在一起,你也不比我聰明,你能上少年班,我也能上’,后面的每一步也是一樣?!?/p>
計算所是兄弟倆“科學家夢”開始的地方。
陳云霽在少年班學的專業(yè)是計算機。當他大四那年聽說計算所在做國產(chǎn)通用處理器(即“龍芯”)時,有過相關(guān)經(jīng)歷的他心里“癢得很”,就想到計算所讀研。
陳云霽本科時成績并不好,“既非最聰明也非最刻苦”,但打心底里對計算機感興趣?!褒埿?號”研制組組長胡偉武注意到這一點,力排眾議招他為研究生,把他帶進“龍芯”研發(fā)團隊。
陳云霽被分在驗證組,主要工作就是編寫測試程序,驗證芯片功能是否正確、能不能“跑得通”。
芯片功能驗證既繁重又枯燥。在芯片模擬器上驗證,速度非常慢,一次操作系統(tǒng)啟動就要兩個星期;發(fā)現(xiàn)了問題還要及時響應(yīng),和工程師一起查找原因、解決問題。為了提高效率,測試工程師一般同時測試多個任務(wù)。但越是這樣,越需要有人一刻不停地在屏幕前盯著,等待“success”最終跳出來。
“既耗人也耗機器?!标愒旗V說,“點燈熬油、通宵達旦是常態(tài)。”
“這么機械的工作,能不能讓機器替人干?”他想,如果驗證、找錯的活兒都能自動化,那就可以飽飽地睡一覺了。
“懶人”推動科技進步!說干就干,沒過多久,陳云霽就和同事搭建起了基于AI程序的驗證平臺—— 一個用AI方法自動化生成的驗證測試程序。
一開始,驗證程序的質(zhì)量參差不齊,有的效率不夠高,有的找錯能力不行。這時候,正在中國科大研究“演化算法”的陳天石送出了關(guān)鍵“助攻”,通過演化算法,他們逐步提高了自動生成的測試程序質(zhì)量。
“讀博期間我花了很多時間做這件事,后來幾個師弟師妹也加入進來。畢業(yè)后不久,胡偉武老師就讓我做‘龍芯’驗證組的組長。”陳云霽說。
胡偉武是大忙人,但他仍投身一線編程序?qū)懶酒a,負責處理器核里面最復(fù)雜的訪存隊列模塊。然而,驗證組查找出訪存隊列的問題后,經(jīng)常找不到人。陳云霽等不了也閑不住,就根據(jù)自己的理解,一邊琢磨一邊動手修改。
“胡老師的代碼大家都不敢改,一來他寫的是很復(fù)雜的部分,很難懂;二來,改錯了怎么辦?”陳云霽記得,胡偉武有次出差回來看到代碼被改了,就質(zhì)問他:“你怎么亂改?都改錯了?!比缓笠晃逡皇馗嬖V他每一步代碼的邏輯道理。
次數(shù)多了,陳云霽慢慢能把胡偉武的代碼改對了。胡偉武見他積極主動、干勁十足,在他博士畢業(yè)一年后破格讓他成為“龍芯三號”主架構(gòu)師中的一員。
2?“別搞這么虛無縹緲的東西了”
成為“龍芯三號”主架構(gòu)師的陳云霽,知識結(jié)構(gòu)日益豐富。業(yè)余時間他又開始琢磨,怎么把AI和芯片設(shè)計的基礎(chǔ)研究交叉,做一款“聰明的芯片”。
“用智能手段做芯片的驗證測試只是填補國內(nèi)空白,我還是想做一些別人從來沒做過的東西?!标愒旗V說。
2010年,陳天石從中國科大博士畢業(yè),加入計算所擔任助理研究員。
兄弟重聚,一有空就探討應(yīng)該做什么樣的研究。討論來討論去,最后認定有兩件事“非常好玩”,一件是用AI輔助做處理器芯片的設(shè)計,另一件是做AI芯片。
但那時,AlphaGo還沒有擊敗李世石,英偉達還只是“游戲顯卡”的代名詞,沒有人知道“AI+芯片”會碰撞出什么樣的火花。
而彼時國內(nèi)市場上芯片“造不如買”,自主研發(fā)通用CPU芯片不受重視;AI給人的感覺是“遙遙無期”,更不受待見。因此,兄弟二人想要做的“聰明的芯片”,是“冷門中的冷門”。
他們也沒有“上帝視角”。陳天石回憶,剛來計算所時他的研究方向是AI,加入的又是“龍芯”處理器團隊,當時心里其實特別忐忑,因為這兩個方向“在當時看來完全沒關(guān)系”。
“用一塊芯片加速處理幾乎所有的深度學習算法程序”的想法,無異于天方夜譚。
他們想不通,學生們更想不通?!安恢挂粋€學生勸我們‘別搞這么虛無縹緲的東西了’,他們跟我說‘陳老師要不您還是帶我們做點不那么非主流的東西吧’。”陳云霽說。
他特別理解學生們的心情。當時,他們這個課題連20萬元的項目都申請不下來。一名學生專門做了調(diào)研:國際上完全沒有類似的論文或工作。
“從原始創(chuàng)新的角度看,當你做的東西在國際上沒有任何相似的東西時,這是一件讓人感到無比激動和興奮的事情。但從功利的角度講,這也意味著干這件事的風險非常大。”陳云霽頓了一下說,“這可能需要一些理想主義?!?/p>
他后來在一篇文章中回顧了這段歲月,其中有段話是這樣寫的:“在一個學術(shù)界不認可、工業(yè)界不關(guān)心、難以發(fā)論文、難以申項目的冷門交叉學科方向孤獨前行,就像在一片黑暗中摸索,不知道哪里是方向、哪里是出口,甚至不知道有沒有出口。”
3?“計算所是做大事的地方”
2010年底,在計算所內(nèi)的一次匯報中,兄弟倆向領(lǐng)導報告了做AI芯片的設(shè)想。
他們不知道該怎么講這天方夜譚般的想法,于是描述了一個場景:大家很早就在說有一天機器會替代人開車,但如果開車的機器人在做模式識別的時候速度不夠快,那就完全沒有讓機器開的理由——當它識別出前面路上的燈或者行人的時候,車已經(jīng)撞上去了。所以,它一定要有很強的車載運算能力。
沒想到,這個通俗的比方打動了所領(lǐng)導,并給出了“你們說得有道理”的評價。
這給了兄弟倆繼續(xù)做下去的信心。
2011年,聚焦于前沿技術(shù)探索的“計算機體系結(jié)構(gòu)國家重點實驗室”(以下簡稱國重實驗室)依托計算所成立。在時任計算所所長、國重實驗室主任孫凝暉的支持下,國重實驗室圍繞“非傳統(tǒng)體系結(jié)構(gòu)方向”設(shè)立了3個研究組,智能處理器團隊(現(xiàn)計算所智能處理器中心)在列。
陳云霽感慨:“在當時的情境下,個人能堅持‘心中的一團火花不熄滅’已屬不易,而孫老師愿意從組織上創(chuàng)建一個新課題組做這樣的研究,就更加難得?!?/p>
對于兄弟倆來說,創(chuàng)立智能處理器團隊的時機恰到好處,因為“如果再晚半年,搶占深度學習處理器研究的國際學術(shù)制高點的機遇,恐怕就錯過了”。
陳云霽記得,2013年的一天,孫凝暉把他叫到辦公室,提出由他擔任智能處理器團隊的課題組負責人(PI),專注于智能處理器的基礎(chǔ)研究。
彼時,陳云霽正處于“科學家和工程師之間的疊加態(tài)”—— 一邊從事通用CPU芯片的工程技術(shù)和產(chǎn)品研制工作,一邊探索智能處理器。顯然,孫凝暉注意到了他這種“難以專注”的狀態(tài)。
“只有專注才能拔尖?!睂O凝暉對他說,“一個人不可能同時做好學術(shù)研究、技術(shù)開發(fā)、產(chǎn)品研制這幾件事,只能分階段來做?!?/p>
面對這位年輕的研究員,孫凝暉為30歲的陳云霽做了長遠打算:“計算所是做大事的地方,研究員僅僅是做大事的起點。要想在市場、用戶那里占有一席之地,還得有超過別人的創(chuàng)新和優(yōu)勢。”
這次深入談話改變了陳云霽的職業(yè)生涯。從那之后,他堅定了信念,再也沒有過任何動搖。
4?“中文發(fā)音的芯片”
沉下心后,他們用詳盡實驗得出的實際數(shù)據(jù),扎扎實實地證明了深度學習處理器的巨大潛力。陳云霽說,他沒想到,這些成果產(chǎn)生了他們不曾想象的學術(shù)影響力。
2014年是兄弟倆豐收的一年。在2014年3月召開的國際頂級學術(shù)會議ASPLOS上,他們和合作伙伴、計算所客座研究員Olivier Temam的成果——《DianNao:一種小尺度的高吞吐率機器學習加速器》獲得了最佳論文獎。這是中國乃至亞洲科研機構(gòu)首次在計算機系統(tǒng)和高性能計算領(lǐng)域頂級國際會議上獲得最佳論文獎。
陳云霽(左)、陳天石兄弟參加論壇活動。
這次獲獎完全在陳云霽意料之外。ASPLOS的頒獎宴會,他和Temam一開始沒打算去,因為“沒想過獲獎這種事跟我們有什么關(guān)系”。當獲獎?wù)呓視詴r,他還在“埋頭苦吃”,根本沒注意臺上在說什么,直到發(fā)現(xiàn)和他一桌的學者都停下刀叉,微笑望著他和Temam。
那一刻他突然“蒙了”,走上臺接過獎牌時依然是一臉茫然。他上一次有這種“怎么可能”的震驚心情,還是在高中校運會獲得3000米跑冠軍的時候。
2014年12月,《DaDianNao:一種機器學習超級計算機》獲處理器架構(gòu)領(lǐng)域另一個頂尖學術(shù)會議MICRO最佳論文——這是MICRO自1963年創(chuàng)辦以來,首次有美國以外國家的學者獲該獎項。
一下子拿到兩個計算機體系結(jié)構(gòu)頂會的最佳論文,兄弟倆才終于意識到,他們蹚出了一條前人不曾涉足的路。
DianNao和DaDianNao在國際上開創(chuàng)的深度學習處理器方向,已經(jīng)成為國際計算機體系結(jié)構(gòu)研究的主流。這兩篇論文的他引很快達到數(shù)千次,施引者遍及全球數(shù)十個國家、數(shù)百個科研機構(gòu)。其中,英偉達是引用最多的機構(gòu)之一。《科學》雜志刊文評價這項工作是深度學習處理器的“先驅(qū)”和“引領(lǐng)者”。
“DianNao”和“DaDianNao”的名字和發(fā)音曾讓國外同行大費周章。一般在國際上發(fā)表研究成果,取名字時都會選一個英語語系里的名字。但兄弟倆反其道而行之,使用中文拼音命名,寓意“電做的大腦”,表達“AI”之義。參加國際會議時,他們經(jīng)常要給外國同行糾正發(fā)音,特別是三聲的“腦”,讓許多外國人卷著舌頭重復(fù)了好多遍。
在他們看來,這兩個名字獨具魅力,“因為此前沒有中文發(fā)音的芯片”。
5?“寒武紀大爆發(fā)”
最佳論文到手后,孫凝暉問兄弟倆:“你們能做出真正的深度學習處理器芯片嗎?”
在國重實驗室,有個不成文的共識——重視論文,但絕不止于發(fā)表論文,要更重視技術(shù)發(fā)明和原型系統(tǒng),將成果實際應(yīng)用于產(chǎn)業(yè)。孫凝暉此問,其實是勉勵他們做出真正的AI芯片。
事實上,在2014年5月31日將DaDianNao論文投稿后,陳云霽就帶著一群研究生坐綠皮火車晃蕩著去了成都—— 一邊放松,一邊著手準備原型芯片的研制。
那幾天,他們晚上在成都的街頭尋訪美食,白天在大學里找間沒人的教室討論芯片研制問題。
回到北京,在中國科學院主管部門和計算所的支持下,課題組全面投入緊張的芯片研制工作。即便已在“龍芯”團隊身經(jīng)百戰(zhàn),作為新PI的陳云霽還是感受到了責任之重。
在實驗室一間不足30平方米、被戲稱為“小黑屋”的玻璃房里,擠滿了智能處理器團隊的成員,幾乎每張1.5米長的桌子前都要坐兩個人,擁擠喧鬧、熱火朝天是常態(tài)。2015年,國際上第一顆深度學習處理器原型芯片的一次流片成功,就是在這里揭曉的。
陳云霽、陳天石都清晰記得那顆芯片流片回來的晚上——
“我們聚在‘小黑屋’里,把芯片和調(diào)試主機的串口連通后,調(diào)試主機屏幕上很快就跳出了深度學習測試結(jié)果正確的信息?!?/p>
接下來就是陳云霽的“個人秀”,他隨手抓起身旁的拖把,即興和學生們表演了一段“舞槍弄棒”。
初為PI的不安感,在那一刻消散了。
陳云霽說,之所以給芯片取名“寒武紀”,最初寓意是這個項目只是一個基礎(chǔ)性支撐,表明它是一個非常早期的起點——就如寒武紀那個遙遠而原始的時代一樣。陳天石也說,寒武紀芯片想做的是“未來無處不在的AI應(yīng)用的墊腳石”。
他們沒想到,這個領(lǐng)域的大爆發(fā)來得迅猛且快速。
2016年春,谷歌公司研發(fā)的AlphaGo一戰(zhàn)成名,AI迅速在全世界掀起浪潮。同年,在計算所和風險投資機構(gòu)的支持下,寒武紀公司成立。
2017年,打上“真正的AI手機”標簽的華為Mate10在“寒武紀芯片”的助攻下取得巨大成功?!昂浼o1A處理器”也成為首款商用深度學習專用處理器。
陳天石展示寒武紀1A芯片。
寒武紀1A原型芯片。
2020年7月20日,寒武紀公司在科創(chuàng)板掛牌上市,上市首日即突破千億元市值。從正式遞交招股書到正式敲鐘上市,寒武紀公司僅用了116天,成為國內(nèi)AI芯片第一股。
寒武紀公司在上海證券交易所“敲鐘”,登陸科創(chuàng)板(左一為陳天石)。計算所供圖
如今將工作重心轉(zhuǎn)向科研管理和基礎(chǔ)研究的陳云霽,已接替孫凝暉,擔任處理器芯片全國重點實驗室(由計算機體系結(jié)構(gòu)國家重點實驗室重組而成)的主任。每當路過“小黑屋”看到里面擠滿了熱火朝天工作的同事和學生時,他的心中仍會升騰起一股熱流。
“寒武紀”的初心,始終沒有忘記。
(原載于《中國科學報》?2024-09-19?第4版?專題)
© 1996 - 中國科學院 版權(quán)所有 聯(lián)系我們 地址:北京市三里河路52號 郵編:100864
京ICP備05002857號-1 京公網(wǎng)安備110402500047號 網(wǎng)站標識碼bm48000002