8月2日,UCIe(通用芯粒高速互連)聯盟宣布阿里巴巴和英偉達新當選董事會成員,加上此前的創始成員日月光半導體、AMD、Arm、谷歌云、英特爾、Meta、微軟、高通、三星、臺積電,該聯盟董事會成員拓展到12家。阿里巴巴也成為首家加入UCIe董事會的大陸企業。
UCIe定義了封裝內Chiplet(芯粒或小芯片)之間的互連標準,以打造開放的芯粒生態系統并更好地支持芯片之間的高速互連。英特爾、AMD、英偉達等主流通用處理器供應商與云廠商積極組建、加入UCIe聯盟,也令Chiplet的生態漸行漸近。
通用處理器企業的技術儲備
如何在制程工藝之外開辟一條繼續提升處理器性能的道路,并使處理器功能更加定制化,覆蓋云服務、深度學習、元宇宙等層出不窮的高性能計算需求,已經成為頭部芯片廠商進行技術研發和儲備的重要考量。此次英偉達加入UCIe董事會,也顯示出主流通用處理器廠商對Chiplet的重視。
各類先進封裝市場營收占比(2016-2022,單位:10億美元)
來源:Yole
對于英特爾而言,Chiplet是延續摩爾定律的技術路線和IDM 2.0戰略的重要組成。英特爾執行副總裁兼數據中心與人工智能事業部總經理Sandra Rivera表示,半導體行業的未來是將多個芯粒集成到一個封裝中,以實現跨細分市場的產品創新,這也是英特爾IDM 2.0戰略的重要一環。英特爾的3D Foveros封裝可以把不同計算功用的小芯片在垂直層面上進行封裝,實現更小更簡單的電路和更快的芯片互聯速度。結合英特爾的封裝微縮技術,Foveros能進一步縮短封裝凸點(裸芯片連接點)的間距,以提升芯片之間和總線的傳輸速率。
AMD也在基于Chiplet技術,推行模塊化的SoC設計理念。早在2019年發布的7nm Zen2架構銳龍處理器中,AMD就采用了Chiplet設計,將不同工藝、不同架構的芯片電路按需搭配,實現更加靈活的配置。AMD面向CPU與GPU互聯的Infinity架構也在第四代版本中支持AMD IP和第三方小芯片的無縫集成。在GPU領域,AMD面向數據中心圖形的CDNA 3架構在單個封裝中結合了5nm小芯片,面向游戲的5nm GPU架構RDNA 3也融入了Chiplet設計,預計每瓦性能提升超50%。
“Chiplet的主要功能就是通過將單芯片中的功能塊分拆出來,通過模塊化封裝實現高集成度單芯片功能,可以用相對成熟的工藝制程去做、成本更低,同時可以實現更短的產品開發周期,實現更快的產品迭代。” 芯謀研究分析師張先揚向《中國電子報》表示。
而向來專注GPU的英偉達,在近兩年推出DPU和Grace CPU之后,顯然也有了在異構計算領域的布局需求。尤其Grace CPU在設計之初就充分考慮了與英偉達GPU的耦合,英偉達為此推出了提供“CPU+GPU一致性內存模型”的NVLink技術。此次加入UCIe聯盟董事會,顯示出英偉達進一步提升GPU、CPU和DPU等芯片集成密度和配置靈活性的意向,未來或將與英特爾、AMD一樣,推出更多面向消費電子和高性能計算的SoC產品。
云廠商融入Chiplet生態
自研服務器處理器乃至加速器,正在成為頭部云廠商的同步動作。相比第三方的通用芯片,自研的定制化芯片能夠使硬件性能與云廠商各自的業務更加匹配,進而實現效能的提升。頭部云廠商還可以基于自身的業務特點和功能需求進行IP的開發和儲備,進而降低芯片的開發和部署成本。同時,定制化的芯片有利于云廠商形成軟硬件閉環,更好地保護客戶的數據安全。
來源:IDC
UCIe聯盟的創始成員谷歌云和本次加入董事會的阿里巴巴,都是“為云造芯”的行家里手。
谷歌研發的TPU被廣泛應用于谷歌翻譯、搜索、相冊等產品以及圍棋機器人Alpha Go的學習模型訓練和計算加速。這種定制化的芯片針對機器學習的工作負載加速進行了優化,支持研究人員、開發者和企業構建可使用CPU、GPU和TPU的TensorFlow(端到端開源機器學習平臺)計算集群。谷歌于2018年向云客戶開放了TPU的beta版本,其2021年發布的TPUv4 可通過4096個TPUv4單芯片組成的POD運算集群釋放高達1exaflop(每秒10的18次方浮點運算)的算力。
阿里巴巴在云端有著相對豐富的自研芯片品類。2021年,阿里巴巴旗下半導體公司平頭哥發布自研ARM服務器芯片倚天710,采用5nm工藝,含128核CPU,面向云場景的高并發、高性能和高能效需求進行設計和優化。今年6月,阿里云發布自研CIPU,其定位是用于加速和管控計算資源的數據中心專用處理器,以進一步提升數據中心的計算、網絡和存儲效率。目前,阿里云已建立芯片、服務器、飛天操作系統等軟硬一體的自研基礎設施。
在不斷積累研發底蘊的同時,云廠商要為客戶提供更加豐富且定制化的產品組合,就需要繼續拓展硬件的產品矩陣。Chiplet不依賴先進制程提升產品性能,且能夠兼容多種IP、芯片的特性,會讓云廠商的硬件開發更加靈活高效。
“Chiplet降低了云廠商的芯片設計門檻,能讓廠商更高效地把產品定義落實到芯片層面。” 開源證券副所長、電子行業首席分析師劉翔向《中國電子報》表示。
而云廠商的加入,也讓Chiplet產業更緊密地結合用戶企業,有利于產業生態的成熟。
“云服務廠商對高性能計算芯片需求不斷攀升,高性能計算和數據中心市場對異構集成有著明確的需求。在市場需求的推動下,Chiplet生態將進一步加速完善。”賽迪顧問集成電路產業研究中心總經理滕冉向《中國電子報》指出。
CHIPLET生態標準需持續完善
從云服務廠商、芯片代工廠、系統原始設備制造商、芯片IP供應商和芯片設計公司紛紛加入UCIe聯盟,不難看出計算產業對于Chiplet標準建設和生態構建的期許。UCIe聯盟主席Debendra Das Sharma表示,目前已經有超過60家企業加入了聯盟。
UCIe等標準的出現,讓Chiplet能夠結合計算產業各個環節的需求,更好地優化技術標準。目前來看,UCIe的技術指標還有進一步提升的空間。
“UCle集聚了一批產業龍頭企業,并推動他們與用戶企業聯合,可以更快推動Chiplet技術的發展。目前UCle標準可以實現的時延遲和傳輸性能還有很大的進步空間,以蘋果為例,UCle對比蘋果的Chiplet技術能力,還有較大差距。Chiplet封裝的工藝也需要不斷完善以實現更高的產品性能。”張先揚說。
同時,人工智能、虛擬仿真、物聯網等技術,使高性能計算不斷涌現新的需求和場景,Chiplet的行業規范和標準也需要與時俱進,覆蓋更多場景需求。
“目前大型芯片企業都推出了基于Chiplet的產品,但各家廠商的互聯標準都是私有協議,限制了不同企業的Chiplet的融合使用,提升了行業進入門檻。UCIe聯盟的建立意在打造Chiplet通用互聯標準,提供高帶寬、低延遲、高性價比的芯片封裝連接。在標準制定方面,Chiplet技術還在不斷演進,行業標準需要緊跟技術發展、市場需求的變化動態調整。” 滕冉說。
(審核編輯: 智匯聞)
分享