新聞資訊
新聞資訊
在 AI 邁向“端邊云協(xié)同”的新時(shí)代,大模型的價(jià)值不僅在于云端的超強(qiáng)算力,更在于能否高效、低成本地部署到千行百業(yè)的終端設(shè)備中。
近日,阿里通義大模型與達(dá)摩院旗下玄鐵 RISC-V 宣布將基于開源架構(gòu)的優(yōu)勢,深度融合,正式推出“Powered by XuanTie,Qwen Inside”技術(shù)戰(zhàn)略——通義大模型算法與基于開源 RISC-V 架構(gòu)的玄鐵處理器將通過軟硬全鏈路協(xié)同優(yōu)化,實(shí)現(xiàn)通義大模型家族在 RISC-V 架構(gòu)上的極致高效部署和推理性能,從端到云以嶄新硬件形態(tài),承載智能能力。未來,雙方將進(jìn)一步實(shí)現(xiàn)“模型即服務(wù),芯片即載體”,攜手生態(tài)伙伴打造下一代超級智能硬件,真正實(shí)現(xiàn) AI 普惠。

玄鐵持續(xù)深耕 RISC-V 架構(gòu)的前沿技術(shù)創(chuàng)新及開源生態(tài)建設(shè),推出能夠滿足高中低性能需求的玄鐵全系列處理器,覆蓋包括智能終端、網(wǎng)絡(luò)通訊、AI 智算、服務(wù)器及周邊等多個行業(yè)場景。通義大模型自發(fā)布以來,已發(fā)布覆蓋語言理解、代碼生成、多模態(tài)感知、語音交互等多個技術(shù)方向的產(chǎn)品,通過前沿 AI 技術(shù),打造安全、可靠、普惠的通用人工智能能力。
過去,大模型部署到端側(cè)常面臨算力不足、功耗高、軟件棧不兼容等難題。此次合作覆蓋通義大模型家族全系列,包括超大規(guī)模 Qwen-Max 、輕量化模型 Qwen-Turbo、多模態(tài)模型 Qwen-VL、語音模型 Qwen-Audio 等全棧產(chǎn)品。RISC-V 的開放性、模塊化設(shè)計(jì)、硬件擴(kuò)展能力、并行計(jì)算支持以及低功耗特性,非常適合 AI 應(yīng)用的需求。如今,在端側(cè)芯片設(shè)計(jì)階段就將通義的計(jì)算圖、算子需求、內(nèi)存訪問模式“前置注入”玄鐵微架構(gòu),實(shí)現(xiàn)了算法與硬件的原生匹配——不僅大幅提升推理效率,更顯著降低部署門檻。

“開源 RISC-V 架構(gòu)為硬件設(shè)計(jì)提供了天然適配 AI 的算力基座。這無疑為不斷迭代的大模型、日趨多樣的智能體以及不斷蝶變激增的算力需求,帶來了革新方案。”通義大模型業(yè)務(wù)經(jīng)理徐棟進(jìn)一步解釋道:“無論是基于 RVV 加速的語言交互系統(tǒng)架構(gòu)優(yōu)化,推動實(shí)現(xiàn)端到端訓(xùn)練及實(shí)時(shí)與端側(cè)整體優(yōu)化的可能;還是得益于 RISC-V AME 獨(dú)立矩陣引擎,能夠充分完成 Qwen3-VL的全鏈路異質(zhì)任務(wù),支撐極致吞吐,讓圖像識別走向認(rèn)知;更能持續(xù)推動 RISC-V 多模態(tài)推理持續(xù)突破新高度,讓圖像推理超越識別,不止于認(rèn)知。我們相信「開源 x 開源」的通義原生 AI Core,會激發(fā)更大潛能!”
“我們不是簡單地將大模型塞進(jìn)設(shè)備,而是從端側(cè)芯片底層開始,為大模型‘量身定制’計(jì)算底座。例如,我們將 Qwen3-Omni 模型輕量化部署到搭載玄鐵處理器的 RISC-V 端側(cè)芯片上,僅用單一模型完成全流程處理,在體積縮小 40%、成本降低 30% 的同時(shí),帶來更流暢、更智能的交互體驗(yàn)?!毙F團(tuán)隊(duì)負(fù)責(zé)人表示,“‘玄鐵 + 通義’的深度融合,也標(biāo)志著一條‘開源芯 + 大模型’的全棧技術(shù)路徑正在形成,讓 AI 有望成為工廠、學(xué)校、社區(qū)和家庭中每一個智能終端的標(biāo)配能力?!?/p>
過去一年,玄鐵再度實(shí)現(xiàn)技術(shù)躍升,發(fā)布面向服務(wù)器場景的高性能旗艦處理器 C930, 集成 512-bit RVV1.0 向量引擎與 8 TOPS Matrix 矩陣雙引擎,并開放 DSA 擴(kuò)展接口,滿足多樣化高性能計(jì)算需求,在 SPECint2006 基準(zhǔn)測試中通用算力性能達(dá) 15/GHz,目前已在服務(wù)器、AI、邊緣計(jì)算等關(guān)鍵場景進(jìn)行規(guī)?;渴稹?/p>
玄鐵 C908X 作為玄鐵旗下首款 AI 專用處理器,兼容 64 位 RVV1.0 架構(gòu)設(shè)計(jì),支持同構(gòu)多核多 Cluster,可提供從 512 到 4096 位的超寬矢量指令,并通過預(yù)置 AI 加速指令實(shí)現(xiàn)AI 運(yùn)算加速,助力用戶利用 RVV 進(jìn)行矩陣計(jì)算、稀疏計(jì)算及非 Tensor 核的特殊計(jì)算。通過擴(kuò)展矢量寬度,C908X 可提供最大 1TOPS/Core/GHz 算力并支持多種 AI 算子庫,從而加速 AI 部署及大模型部署。同年,基于 C908X 處理器,玄鐵發(fā)布面向端側(cè)智能場景的全棧 RISC-V AI 方案,構(gòu)建了覆蓋端側(cè)、邊緣側(cè)到云側(cè)的完整軟硬件生態(tài),可應(yīng)對多樣化的 AI 計(jì)算需求,為邊緣 AI 推理、智能駕駛、工業(yè)自動化和智能終端等場景,提供強(qiáng)有力的支持,滿足低延時(shí)長續(xù)航、高精度推理、高效數(shù)據(jù)處理等業(yè)務(wù)需求。
面對 AI 等新興場景對定制化算力的迫切需求,玄鐵創(chuàng)新推出全新 Flex 系列可擴(kuò)展平臺,開創(chuàng)“通用 IP + 自定義加速”雙軌模式??蛻艏瓤芍苯硬捎酶呖煽康男F處理器 IP,亦可基于 Flex 提供的全套軟硬件框架(含處理器建模、開發(fā)環(huán)境及工具鏈)打造專屬加速器。經(jīng)實(shí)測,基于 Flex-C 定制的處理器相較通用版本最高可實(shí)現(xiàn) 10 倍性能提升。目前,F(xiàn)lex 系列已與高性能 C 系列無縫兼容,并將逐步拓展至嵌入式 E 系列與實(shí)時(shí)控制 R 系列,全面覆蓋多元應(yīng)用場景。

未來,雙方將持續(xù)開放玄鐵 IP 與通義大模型的協(xié)同工具鏈,攜手端側(cè)芯片廠商、整機(jī)企業(yè)與行業(yè) ISV,借助 RISC-V 自身的智能架構(gòu)優(yōu)勢,推動“Qwen Inside”走進(jìn)機(jī)器人、工業(yè)控制、車載終端、端側(cè)智能、服務(wù)器及周邊等萬千場景,讓大模型真正“落地生根”,賦能千行百業(yè)智能化升級。
Powered by XuanTie, 基于開源的創(chuàng)新加速時(shí)代,正式到來!
發(fā)布日期: 2024-06-07
發(fā)布日期: 2025-04-09
發(fā)布日期: 2023-07-04
發(fā)布日期: 2024-02-06
發(fā)布日期: 2024-05-29
發(fā)布日期: 2024-06-27
發(fā)布日期: 2026-01-13
發(fā)布日期: 2024-06-27
發(fā)布日期: 2026-01-16
發(fā)布日期: 2026-01-16
發(fā)布日期: 2026-01-16
發(fā)布日期: 2026-01-16
發(fā)布日期: 2026-01-16