高通總裁暨執行長Cristiano Amon表示,代理式AI正大幅推升資料中心對AI推論的需求,未來資料中心必須在更低功耗與更低成本下提供更高效能,而這正是高通的核心優勢。透過Qualcomm Dragonfly產品組合,公司將高效能、低功耗運算帶入資料中心,並已與多家領先客戶簽署多年、多世代合作協議。
此次發表的Dragonfly平台涵蓋CPU、AI推論加速器、高頻寬運算、客製化矽晶片及高速互連技術。其中,Dragonfly C1000 CPU採用自家Qualcomm Oryon CPU核心與Chiplet架構,鎖定代理式AI、通用運算及AI Head Node等資料中心工作負載,強調高效能、低功耗及低總體擁有成本(TCO),預計2028年正式商用。
在AI加速器方面,高通同步推出Dragonfly AI300,採用第二代高頻寬運算(HBC)近記憶體運算架構,透過整合式記憶體設計提升有效記憶體頻寬,支援大型語言模型(LLM)、大型多模態模型(LMM)及代理式AI推論等高負載應用,預計2028年開始提供商用樣品。至於搭載第一代HBC的AI250,則預計於2027年年中開始提供商用樣品。
高通表示,HBC採用3D堆疊近記憶體運算架構,可有效降低AI運算中的資料搬移瓶頸,相較既有架構提供更高的記憶體頻寬與能源效率,並透過機架級設計支援大規模AI推論部署。此外,公司亦同步推出客製化矽晶片解決方案及涵蓋晶片、銅纜、光纖至園區級互連的高速連接產品,支援最高800G及1.6T頻寬,滿足下一代AI資料中心需求。
在生態系布局方面,高通宣布已與Meta簽署多年、多世代合作協議,未來將成為Meta資料中心CPU供應商,Qualcomm Dragonfly C1000預計將導入Meta下一代伺服器平台。
除Meta外,高通表示,目前已有超過35家全球科技與AI產業夥伴支持其資料中心布局,包括仁寶、台達電、鴻海、技嘉科技、英業達、廣達、和碩、聯華電子、南亞科技及緯創等10家台灣合作夥伴;海外合作夥伴則包括Advantest、Arista、Astera、Cirrascale、Confidential Core AI、Core42、Fibercop、HUMAIN、IONOS、聯想、Master Works、微芯科技、美光科技、NEC、NeuReality、三星SDS、Saptiva AI、美國SK海力士、超微、Teradyne、TeraHop、VAST Data、Viettel IDC及VNPT Group,共同推動AI資料中心生態系發展。
點擊閱讀下一則新聞