人工智能正在向芯片設(shè)計領(lǐng)域邁進。2021年6月,谷歌大腦(Google Brain)項目的研究人員稱,他們開發(fā)了一種機器學(xué)習(xí)系統(tǒng),該系統(tǒng)在短時間內(nèi)就可生成人類專家需耗費大量時間才能生成的可制造的芯片版圖。
中國工程院院刊《Engineering》2022年第3期刊發(fā)《機器學(xué)習(xí)推動人類芯片設(shè)計》一文。文章報道了谷歌團隊運用由深度神經(jīng)網(wǎng)絡(luò)組成的人工“智能體”,通過機器學(xué)習(xí),進行芯片設(shè)計的過程,總結(jié)了該智能體設(shè)計的芯片與傳統(tǒng)人工設(shè)計的區(qū)別,并展望了未來的發(fā)展?jié)摿?。文章指出,機器學(xué)習(xí)將加快更強大芯片的開發(fā)速度,而芯片設(shè)計反過來也會加快機器學(xué)習(xí)的速度。
從國際象棋到圍棋,如今,人工智能(AI)正在挑戰(zhàn)人類在更復(fù)雜、更具商業(yè)價值領(lǐng)域(即設(shè)計微芯片)的統(tǒng)治地位。2021年6月,谷歌大腦(Google Brain)項目的研究人員稱,他們開發(fā)了一種機器學(xué)習(xí)系統(tǒng),該系統(tǒng)在短時間內(nèi)就可生成人類專家需耗費大量時間才能生成的可制造的芯片版圖。6月10日,《自然》雜志網(wǎng)絡(luò)版發(fā)布了一篇文章,科學(xué)家Azalia Mirhoseini和Anna Goldie帶領(lǐng)的谷歌研究團隊在這篇文章中指出:“我們的方法能讓AI在6 h內(nèi)生成芯片版圖,生成的芯片版圖在幾乎所有關(guān)鍵指標(biāo)(包括功耗、性能和芯片面積)上均能達(dá)到甚至優(yōu)于人類設(shè)計的芯片版圖。”
雖然其他公司,如楷登電子(Cadence)、國際商業(yè)機器公司(IBM)和英偉達(dá)(NVIDIA)已經(jīng)實現(xiàn)了自身基于機器學(xué)習(xí)的芯片設(shè)計解決方案,但是谷歌公司的AI技術(shù)無疑是使其成為第一個在芯片版圖設(shè)計領(lǐng)域超越人類的公司。這一壯舉是AI領(lǐng)域的一個重要里程碑,可能會大大縮短新型微處理器和其他先進芯片的開發(fā)時間?!蹲匀弧冯s志的編輯稱贊這一壯舉為“一項有助于加速芯片供應(yīng)鏈的重要成就”。事實上,谷歌公司已經(jīng)將這一系統(tǒng)投入使用,為公司下一代AI加速芯片設(shè)計版圖。
版圖設(shè)計是微芯片物理設(shè)計的早期階段(圖1)。包括在代表芯片表面的矩形區(qū)域中布置大的內(nèi)存和邏輯控制單元(即宏)。繪制出初始版圖后,在剩余的開放空間中布置較小的邏輯塊(即標(biāo)準(zhǔn)單元),并布線將宏和單元連接起來。
圖1. 版圖設(shè)計是半導(dǎo)體物理設(shè)計的早期步驟,包括在芯片表面布置大的功能塊(即宏),同時綜合考慮芯片尺寸、性能和功耗。版圖設(shè)計之后是標(biāo)準(zhǔn)單元的布置、互連布線和時序優(yōu)化。IC:集成電路。來源:Wikimedia Commons(公共領(lǐng)域)。
芯片版圖設(shè)計是一項精密的工作,設(shè)計時需要綜合考慮芯片面積、性能和功耗。版圖設(shè)計人員試圖在最小化芯片區(qū)域的同時,盡可能縮短布線長度,避免走線擁擠,并滿足時間要求和其他設(shè)計標(biāo)準(zhǔn)??傮w目標(biāo)是實現(xiàn)芯片性能、功耗和成本的最優(yōu)組合。
這是一項艱巨而復(fù)雜的任務(wù)。當(dāng)今較大的芯片可能有數(shù)百或數(shù)千個宏和數(shù)百萬或數(shù)十億個標(biāo)準(zhǔn)單元,其布線可能長達(dá)數(shù)公里。芯片中可能需要進行布局設(shè)計的模塊數(shù)量幾乎是天文數(shù)字。例如,Mirhoseini等稱,谷歌研究團隊設(shè)計的版圖可能有超過102500個模塊需要進行布局設(shè)計。相比之下,圍棋需要布局設(shè)計的模塊僅為10360個。版圖組合方式的復(fù)雜性意味著僅憑“蠻力”來計算是不可能的;即使用上世界上的全部算力,在數(shù)百萬年內(nèi)也不能嘗試完所有可能的解決方案。
相反,傳統(tǒng)的優(yōu)化方法通過使用簡化模型和啟發(fā)式算法(經(jīng)驗法則)簡化了這個問題。到目前為止,直覺力強且經(jīng)驗豐富的人類芯片設(shè)計師在運用上述優(yōu)化方法方面比機器驅(qū)動的算法表現(xiàn)得更好。加利福尼亞大學(xué)圣克魯茲分校計算機科學(xué)與工程系教授Mathew Guthaus說道:“計算機面臨著復(fù)雜的資源優(yōu)化問題,比如布局規(guī)劃,這其中有很多需要權(quán)衡的因素。這就相當(dāng)于雜耍球,如果你掉了一個球,那么其他的球都會掉下來。”Guthaus曾獲得過谷歌公司提供的研究資金,但他并未參與該項目。
盡管人們對自動優(yōu)化技術(shù)的研究已有數(shù)十年的歷史,但技藝精湛的人類版圖設(shè)計師仍能在更短的時間內(nèi)做出更好的設(shè)計。但即使是最厲害的設(shè)計師,版圖設(shè)計也是一個漫長而又艱苦的過程。在這個過程中,版圖都是手工繪制的,在設(shè)計的過程中還需要反復(fù)調(diào)整。一個版圖可能需要數(shù)周或數(shù)月的時間才能最終確定下來。
隨著AI等領(lǐng)域?qū)Ω鼜姶笮酒枨蟮募ぴ觯涌爝@一設(shè)計過程已成為科技行業(yè)的首要任務(wù)。Mirhoseini表示:“自2012年以來,AI技術(shù)的最大計算能力每幾個月翻一番——遠(yuǎn)遠(yuǎn)快于摩爾定律(Moore’s Law)中的翻番周期。”對于谷歌公司而言,用機器學(xué)習(xí)解決上述問題似乎是必然之選。谷歌公司既是一個多產(chǎn)的AI技術(shù)用戶,也是一個領(lǐng)先的AI創(chuàng)新者。
具體來說,谷歌團隊使用了一種強化學(xué)習(xí)技術(shù),即由深度神經(jīng)網(wǎng)絡(luò)(一種多層神經(jīng)網(wǎng)絡(luò))組成的人工“智能體”通過試錯進行學(xué)習(xí)。當(dāng)布置宏并探索各種版圖設(shè)計時,智能體會收到不同布線長度、擁擠程度和密度的傳輸信號。好的傳輸信號會加強神經(jīng)網(wǎng)絡(luò)的內(nèi)部聯(lián)系,并且隨著時間的推移會變得更好。
按照這種方式進行訓(xùn)練,該系統(tǒng)在第一次嘗試后的短短幾個小時內(nèi)就可生成可用的版圖,無需進行人類設(shè)計師通常需要的多次迭代。與傳統(tǒng)自動優(yōu)化方法(如模擬退火)進行一對一比較時,該系統(tǒng)的速度明顯更快,設(shè)計的質(zhì)量更高(從布線長度、時間、走線擁擠程度、面積和功率等方面衡量)。與人工設(shè)計版圖相比,該系統(tǒng)設(shè)計版圖的速度要快得多;在大多數(shù)情況下,其質(zhì)量甚至超過了人工設(shè)計的版圖。Guthaus說道:“這非常令人興奮,結(jié)果看起來很驚人。”他曾警告稱:“仍需要與一流的人類設(shè)計進行大量比較。”
與傳統(tǒng)的自動化系統(tǒng)和人工系統(tǒng)相比,該系統(tǒng)最大的優(yōu)點是可以從大量的實例中學(xué)習(xí)。隨著經(jīng)驗的積累,該系統(tǒng)會變得更加熟練和靈活。谷歌團隊表示,隨著訓(xùn)練的芯片數(shù)量不斷增多,我們的方法在為之前看不見的芯片塊快速設(shè)計最優(yōu)位置方面將表現(xiàn)得更好。在植入10 000個版圖示例進行預(yù)先訓(xùn)練后,該系統(tǒng)獲得了“不同芯片通用”的能力——能為各種芯片類型建立版圖。谷歌團隊稱,這一壯舉就像掌握了多種不同規(guī)則的游戲。
有趣的是,機器生成的版圖與人工繪制的版圖完全不同。人類設(shè)計師通常將宏排列成整齊的行和列,將相關(guān)的功能緊密地排列在芯片的外圍,而將內(nèi)部區(qū)域留給標(biāo)準(zhǔn)單元。這樣做的結(jié)果就像網(wǎng)格狀的公寓單元被寬闊的干道隔開一樣(圖2)。相比之下,谷歌公司AI自動生成的版圖中宏的排列幾乎是隨機的[ Goldie稱它們看起來“像外星人”(alien-looking)]:宏和開放區(qū)域拼接在一起,分散在芯片上,沒有明顯的形狀。
圖2. 人類設(shè)計師通常按功能(處理器塊、內(nèi)存、邏輯控制等)對宏進行分組,從而創(chuàng)造出有序的設(shè)計。然后,各組宏之間的開放區(qū)域用更小的邏輯塊(標(biāo)準(zhǔn)單元)和連接線(連接各個塊的布線)填充。
谷歌團隊表示,這種新方法有可能為每一代新款芯片的生成節(jié)省數(shù)千小時的人力。加利福尼亞大學(xué)圣迭戈分校電子工程與計算機科學(xué)教授Andrew Kahng認(rèn)為:“自動化芯片設(shè)計方案比目前的方法發(fā)展得更好、更快,成本更低,有助于保持芯片技術(shù)遵循‘摩爾定律’軌跡。”此外,與人類設(shè)計師相比,該系統(tǒng)的設(shè)計速度更快,可以嘗試更多種設(shè)計方案;人類設(shè)計師需手動設(shè)計芯片版圖,設(shè)計速度比較慢,且設(shè)計時間安排的比較緊湊。
該系統(tǒng)的優(yōu)勢似乎不僅僅體現(xiàn)在理論上。谷歌公司迅速將其自動化系統(tǒng)投入實際應(yīng)用,為公司的下一代張量處理器(TPU)建立可制造的版圖。TPU是一種專為機器學(xué)習(xí)開發(fā)的專用集成電路(ASIC),專門為加速對許多谷歌服務(wù)(包括互聯(lián)網(wǎng)搜索、街景、谷歌照片,以及基于云計算的商用AI服務(wù))至關(guān)重要的機器學(xué)習(xí)系統(tǒng)而設(shè)計。
谷歌團隊最終預(yù)測,機器學(xué)習(xí)將加快更強大芯片的開發(fā)速度,而芯片設(shè)計反過來也會加快機器學(xué)習(xí)的速度。Mirhoseini稱:“在過去幾十年中,系統(tǒng)和硬件真的改變了機器學(xué)習(xí)技術(shù)?,F(xiàn)在是機器學(xué)習(xí)技術(shù)給予回饋的時候,它將改變系統(tǒng)和硬件的設(shè)計方式。”
芯片設(shè)計可能只是個開始。Mirhoseini等說:“這種形式的布局優(yōu)化方案可廣泛應(yīng)用于科學(xué)和工程設(shè)計,包括硬件設(shè)計、城市規(guī)劃、疫苗測試與分配,以及大腦皮層布局。因此,我們相信這種布局優(yōu)化方案可以解決芯片設(shè)計以外重要的布局問題。”
