“隨著人工智能時代的深度演進,疊加今年以來以DeepSeek為代表的國產(chǎn)大模型密集落地,智能計算行業(yè)正迎來爆發(fā)式增長機遇?!焙銚P數(shù)據(jù)副總經(jīng)理兼智算產(chǎn)品線總監(jiān)李浩杰在接受證券時報記者采訪時表示。依托基于FPGA的DPU架構(gòu)在可編程靈活性、并行處理能力及低時延等方面的技術(shù)優(yōu)勢,恒揚數(shù)據(jù)已構(gòu)建起覆蓋從中心節(jié)點到邊緣端側(cè)的完整算力產(chǎn)品和解決方案,通過與行業(yè)頭部企業(yè)的深度合作,在安全、互聯(lián)網(wǎng)、運營商等垂直領(lǐng)域持續(xù)發(fā)力,打造企業(yè)智算高地。
構(gòu)建算力“第三極核心”
作為恒揚數(shù)據(jù)發(fā)展的戰(zhàn)略重心,公司智能計算業(yè)務(wù)重點布局AI智算中心、云計算數(shù)據(jù)中心及邊緣計算核心基礎(chǔ)設(shè)施的建設(shè)。核心產(chǎn)品矩陣涵蓋整機、板卡部件和算力單元三大類別,包括AI算力集群的DPU(數(shù)據(jù)處理單元)、AI智算一體機/DPI智算一體機,以及AI算力集群交換機等關(guān)鍵設(shè)備。
其中,在邊緣計算場景中,DPI智算一體機融合DPU、CPU與GPU的異構(gòu)算力,可同時支撐數(shù)據(jù)處理與應(yīng)用分析雙重任務(wù)。
李浩杰指出,公司通過將交換芯片、CPU、GPU與FPGA/DPU能力進行有機整合,形成了極具差異化的解決方案。依托在數(shù)據(jù)處理與網(wǎng)絡(luò)可視化方面的技術(shù)積累,目前公司正持續(xù)向運營商、安全、互聯(lián)網(wǎng)以及能源交通等垂直行業(yè)拓展深耕。
在中心側(cè),作為新型專用處理器的DPU部件,已成為AI算力集群組網(wǎng)中不可替代的核心組件,恒揚數(shù)據(jù)已在國內(nèi)率先實現(xiàn)十萬卡級部署。
“我們將DPU定義為繼CPU和GPU之后的第三大核心芯片。CPU承擔通用算力輸出,GPU專注智能計算加速,而DPU則實現(xiàn)了充分釋放CPU和GPU算力的角色,并有效實現(xiàn)了多機之間的高效互聯(lián)和協(xié)同。”李浩杰表示,DPU目前主要承擔數(shù)據(jù)包解析與轉(zhuǎn)發(fā)、虛擬化等任務(wù),可有效卸載CPU原本承載的部分系統(tǒng)管理工作,在萬卡級GPU集群互聯(lián)中發(fā)揮著不可替代的關(guān)鍵作用。
通過整合DPU、CPU與GPU的多芯異構(gòu)融合技術(shù),恒揚數(shù)據(jù)打造出兼具高性能、高密度與智算通算的智能計算一體化產(chǎn)品系列,形成了從邊緣計算智能網(wǎng)卡、核心部件、整機刀片到云端協(xié)同的全棧解決方案,廣泛適配運營商、政企及安全等行業(yè)的多元應(yīng)用場景。
大幅提升AI集群效率
在AI算力集群領(lǐng)域,恒揚數(shù)據(jù)正全力攻克Scale-out架構(gòu)下的三大技術(shù)難關(guān):多GPU卡間400G甚至800G高帶寬低延遲互聯(lián)、集群網(wǎng)絡(luò)流量智能調(diào)度及RDMA遠程存儲優(yōu)化。
李浩杰介紹,基于FPGA的DPU具備的高度可定制特性,使其能夠快速響應(yīng)智算中心技術(shù)迭代需求,成為支撐智算中心實現(xiàn)低時延運行與高效調(diào)度的重要技術(shù)底座。
得益于公司在FPGA架構(gòu)下DPU設(shè)計、芯片研發(fā)、系統(tǒng)開發(fā)及軟件算法工程化等領(lǐng)域的深厚積累,恒揚數(shù)據(jù)能夠為客戶提供靈活高效的DPU數(shù)據(jù)加速解決方案,大幅提升AI集群效率。
2024年3月,公司自主研發(fā)的“基于FPGA/DPU的AI集群網(wǎng)絡(luò)專用DPU設(shè)備的關(guān)鍵技術(shù)研究及產(chǎn)業(yè)化”項目成功入選國家科技成果庫。該項目不僅實現(xiàn)了從傳統(tǒng)CPU單一處理模式向CPU+GPU+DPU協(xié)同架構(gòu)的范式升級,更將集群通信效率提升10-100倍,有效破解了GPU與網(wǎng)卡性能不匹配的行業(yè)痛點。
同時,依托基于FPGA的DPU的可編程特性,該DPU設(shè)備支持用戶自定義協(xié)議,進一步滿足數(shù)據(jù)中心對私有化、高性能網(wǎng)絡(luò)和擁塞算法的多樣化需求。實測數(shù)據(jù)顯示,該設(shè)備可將AI訓練任務(wù)中的通信延遲降至微秒級,帶寬利用率提升至95%以上,為大規(guī)模AI模型訓練提供性能支撐。
構(gòu)建智算生態(tài)“共同體”
基于FPGA的DPU領(lǐng)域的持續(xù)深耕,以及與主流廠商在IP層面的深度協(xié)同,恒揚數(shù)據(jù)的技術(shù)實力已獲得業(yè)界高度認可。公司不僅與多家領(lǐng)先科技企業(yè)建立了穩(wěn)固的合作關(guān)系,還在2024年成為首批鯤鵬最高級別認證的“KPN鉆石合作伙伴”。
在8月15日恒揚數(shù)據(jù)新品推介會暨展車體驗活動中,鯤鵬昇騰與恒揚數(shù)據(jù)聯(lián)合推出的K+A一體機及SempFusion智算平臺。作為華南乃至全國范圍內(nèi)的首批旗艦合作機型,基于SK90智算一體機與昇騰Atlas300IA2加速卡深度融合K+A一體機的推出,將有望加速推進鯤鵬昇騰生態(tài)伙伴上游企業(yè)智能化轉(zhuǎn)型與應(yīng)用落地進程。
(恒揚數(shù)據(jù)發(fā)布K+A一體機 圖片來源:恒揚數(shù)據(jù))
在與軟件企業(yè)的協(xié)同合作領(lǐng)域,恒揚數(shù)據(jù)高度重視軟件生態(tài)建設(shè)。據(jù)李浩杰介紹,公司積極聯(lián)合高校與科研機構(gòu)開展跨平臺合作,聚焦硬件設(shè)計優(yōu)化與系統(tǒng)可靠性提升,為智算技術(shù)的規(guī)?;瘧?yīng)用奠定堅實的軟硬生態(tài)協(xié)同應(yīng)用基礎(chǔ)。