4月3日,由中國電信聯合阿里雲建設的粵港澳大灣區首個「真武」萬卡智算集群在韶關數據中心正式上線。作為國家「超大規模智算集群」新基建工程在大灣區的首個落地項目,該集群實現了從芯片、雲平台到模型應用的全鏈路自主研發,標誌着國內先進算力正從高端性能突破邁向規模化產業落地。
據介紹,該集群在技術層面實現了多項關鍵突破。集群採用新一代高性能組網架構,端到端數據傳輸時延低至4微秒,網絡峰值利用率超過95%,上萬張芯片得以像一台超級計算機一樣協同工作,穩定承載千億參數級大模型的訓練與推理任務。單機性能同樣突出——單台「真武」伺服器配備1.5T超大顯存,片間互聯帶寬700GB/s,Qwen3.5、DeepSeek-V3.2全參數版等主流開源大模型均可在單機上直接部署運行。在開發生態層面,「真武」芯片已全面適配主流AI框架與工具鏈,並提供統一編程接口,開發者無需重寫代碼即可將已有業務平滑遷移至國內算力平台。
在此基礎上,集群提供了從IaaS、PaaS到MaaS的全棧AI雲能力,用戶既可以用它訓練自己的專屬模型,也可以直接調用已有的大模型能力。得益於針對「真武」芯片深度優化的工具套件,模型運行環境可在秒級完成加載,單個模型的微調最快數小時即可完成,整體訓練與推理效率較通用方案提升超過30%。這種「開箱即用」的模式,讓用戶無需受困於底層建設與反覆調參。
目前,該集群已在諸多行業場景落地。在醫療民生領域,集群上線「全診通」應用,面向基層醫療機構提供診療智能化服務,已在中山大學腫瘤防治中心等醫院開展應用試點;在產業創新領域,為電子信息、先進材料、生物醫藥、裝備製造、低空經濟等重點產業提供模型訓練、推理與調優服務,有效縮短創新周期。
依託阿里全棧AI技術帶來的協同優化,集群單卡吞吐性能較傳統部署模式提升達9.3倍,單機每秒Token生成量實現近10倍。為進一步推動算力普惠,相關資源已同步上架「廣東電信算力超市」,面向中小企業提供按卡、按小時計費的算力零售服務。同時,集群預計擴容至十萬卡規模,助力大灣區更多科研機構、企業和政府單位以更低成本、更高效率使用算力資源。(讀特&深圳商報、讀創首席記者 陳小慧)
圖説:粵港澳大灣區首個「真武」萬卡智算集群上線。(阿里雲供圖)