你的位置:首頁(yè) > 傳感技術(shù) > 正文

專(zhuān)為大模型而生:安謀科技發(fā)布"周易"X3 NPU,重塑端側(cè)AI計(jì)算格局

發(fā)布時(shí)間:2025-11-13 責(zé)任編輯:lina

【導(dǎo)讀】在人工智能向端側(cè)全面擴(kuò)展的產(chǎn)業(yè)背景下,安謀科技(中國(guó))今日在上海正式發(fā)布全新一代神經(jīng)網(wǎng)絡(luò)處理器IP——"周易"X3。這款基于創(chuàng)新DSP+DSA混合架構(gòu)的NPU專(zhuān)為端側(cè)大模型計(jì)算而設(shè)計(jì),在AI推理性能上實(shí)現(xiàn)突破性提升,為基礎(chǔ)設(shè)施、智能汽車(chē)、移動(dòng)終端和智能物聯(lián)網(wǎng)四大核心領(lǐng)域提供強(qiáng)勁的AI算力支撐。


摘要:AIGC大模型能力提升10倍,8-80 FP8 TFLOPS,單Core帶寬256GB/s,Prefill算力利用率達(dá)72%,Decode有效帶寬利用率超100%。

 

2025 年 11 月 13 日,在人工智能向端側(cè)全面擴(kuò)展的產(chǎn)業(yè)背景下,安謀科技(中國(guó))今日在上海正式發(fā)布全新一代神經(jīng)網(wǎng)絡(luò)處理器IP——"周易"X3。這款基于創(chuàng)新DSP+DSA混合架構(gòu)的NPU專(zhuān)為端側(cè)大模型計(jì)算而設(shè)計(jì),在AI推理性能上實(shí)現(xiàn)突破性提升,為基礎(chǔ)設(shè)施、智能汽車(chē)、移動(dòng)終端和智能物聯(lián)網(wǎng)四大核心領(lǐng)域提供強(qiáng)勁的AI算力支撐。

 

專(zhuān)為大模型而生:安謀科技發(fā)布"周易"X3 NPU,重塑端側(cè)AI計(jì)算格局

安謀科技Arm China產(chǎn)品研發(fā)副總裁劉浩


安謀科技Arm China產(chǎn)品研發(fā)副總裁劉浩表示:“在‘All in AI’產(chǎn)品戰(zhàn)略的指引下,我們將持續(xù)加大投入,以前瞻性視野整合頂尖研發(fā)資源,秉持開(kāi)放合作理念,為生態(tài)伙伴提供業(yè)界領(lǐng)先的從硬件、軟件到服務(wù)的端到端解決方案,全力賦能伙伴的產(chǎn)品創(chuàng)新和商業(yè)化落地?!?/p>

 

專(zhuān)為大模型而生:安謀科技發(fā)布"周易"X3 NPU,重塑端側(cè)AI計(jì)算格局

“周易”X3 NPU IP新品發(fā)布會(huì)現(xiàn)場(chǎng)

 

性能躍遷

前瞻五年布局,讓端側(cè)大模型“跑得穩(wěn)、答得順”

 

在半導(dǎo)體IP領(lǐng)域,“面向未來(lái)5年的產(chǎn)品方向進(jìn)行前瞻布局”已成為行業(yè)共識(shí)——涵蓋IP研發(fā)、芯片及終端產(chǎn)品研發(fā)量產(chǎn)。安謀科技Arm China深諳這一規(guī)律,前瞻性地在“周易”X3中采用兼顧C(jī)NN與Transformer的通用架構(gòu)設(shè)計(jì),支持全算力類(lèi)型并增強(qiáng)浮點(diǎn)運(yùn)算FLOPS,助力實(shí)現(xiàn)從定點(diǎn)到浮點(diǎn)計(jì)算的關(guān)鍵轉(zhuǎn)變,并滿(mǎn)足大模型計(jì)算需求,為未來(lái)5年Gen AI、Agentic AI與Physical AI的端側(cè)落地奠定技術(shù)基石。

 

隨著AI大模型技術(shù)的飛速發(fā)展,智能手機(jī)、AI PC和智能汽車(chē)等端側(cè)設(shè)備正迎來(lái)AI能力的爆發(fā)性需求。從多模態(tài)語(yǔ)音助手到實(shí)時(shí)圖像生成,從智能座艙交互到輔助駕駛決策,端側(cè)設(shè)備需要承載越來(lái)越復(fù)雜的AI計(jì)算任務(wù)。然而,端側(cè)AI部署面臨算力受限、能效要求高、帶寬瓶頸、開(kāi)發(fā)門(mén)檻高等多重挑戰(zhàn)——如何在有限的功耗和算力資源下實(shí)現(xiàn)大模型的高效運(yùn)行,成為行業(yè)亟需突破的關(guān)鍵難題。

 

“周易”X3基于專(zhuān)為大模型而生的最新DSP+DSA架構(gòu),從計(jì)算效率、帶寬、精度適配、任務(wù)處理四大維度實(shí)現(xiàn)升級(jí),精準(zhǔn)解決端側(cè)AI大模型運(yùn)行難題,打造端側(cè)AI計(jì)算效率的新標(biāo)桿。

 

其單Cluster最高支持4個(gè)Core,擁有8~80 FP8 TFLOPS算力且可靈活配置,單Core帶寬高達(dá)256GB/s。相較于“周易”X2產(chǎn)品,“周易”X3的CNN模型性能提升30%~50%,多核算力線(xiàn)性度達(dá)到70%~80%。在同算力規(guī)格下,AIGC大模型能力較上一代產(chǎn)品實(shí)現(xiàn)10倍增長(zhǎng),這得益于16倍的FP16 TFLOPS、4倍的計(jì)算核心帶寬、超過(guò)10倍的Softmax和LayerNorm性能提升共同驅(qū)動(dòng)。

 

借助這些優(yōu)化,端側(cè)大模型推理將更高效:在Llama2 7B大模型實(shí)測(cè)中,“周易”X3 NPU IP在Prefill階段算力利用率高達(dá)72%,并在安謀科技Arm China自研的解壓硬件WDC的加持下,實(shí)現(xiàn)Decode階段有效帶寬利用率超100%,遠(yuǎn)超行業(yè)平均水平,滿(mǎn)足大模型解碼階段的高吞吐需求。

 

專(zhuān)為大模型而生:安謀科技發(fā)布"周易"X3 NPU,重塑端側(cè)AI計(jì)算格局

“周易”X3 NPU IP新品亮點(diǎn)

 

此外,“周易”X3在架構(gòu)層面實(shí)現(xiàn)了多項(xiàng)創(chuàng)新,集成以下關(guān)鍵特性:

l 集成自研解壓硬件WDC:使大模型Weight軟件無(wú)損壓縮后通過(guò)硬件解壓能獲得額外15%~20%等效帶寬提升。

l 新增端側(cè)大模型運(yùn)行必備的W4A8/W4A16計(jì)算加速模式:對(duì)模型權(quán)重進(jìn)行低比特量化,大幅降低帶寬消耗,支持云端大模型向端側(cè)的高效遷移。

l 集成AI專(zhuān)屬硬件引擎AIFF(AI Fixed-Function)與專(zhuān)用硬化調(diào)度器:實(shí)現(xiàn)超低至0.5%的CPU負(fù)載與低調(diào)度延遲,靈活支持端側(cè)多任務(wù)場(chǎng)景和任意優(yōu)先級(jí)調(diào)度場(chǎng)景,確保高優(yōu)先級(jí)任務(wù)的即時(shí)響應(yīng)。

l 支持int4/int8/int16/int32/fp4/fp8/fp16/bf16/fp32多精度融合計(jì)算,強(qiáng)浮點(diǎn)計(jì)算:可靈活適配智能手機(jī)邊緣部署、AI PC推理、智能汽車(chē)等從傳統(tǒng)CNN到前沿大模型的數(shù)據(jù)類(lèi)型需求,平衡性能與能效。

 

專(zhuān)為大模型而生:安謀科技發(fā)布"周易"X3 NPU,重塑端側(cè)AI計(jì)算格局 

安謀科技Arm China產(chǎn)品總監(jiān)鮑敏祺

 

安謀科技Arm China產(chǎn)品總監(jiān)鮑敏祺指出:“‘周易’X3遵循‘軟硬協(xié)同、全周期服務(wù)與成就客戶(hù)’的產(chǎn)品準(zhǔn)則,提供從硬件、軟件到售后服務(wù)的全鏈路支持,以前瞻性設(shè)計(jì)、專(zhuān)業(yè)團(tuán)隊(duì)交付與深度服務(wù)投入,全面助力客戶(hù)產(chǎn)品成功與商業(yè)化落地?!?/p>

 

軟硬協(xié)同

從“好用”到“用好 ”,Compass“金牌輔助”提升開(kāi)發(fā)效率

 

“周易”X3 NPU IP不僅提供高性能硬件,還配套完善易用的“周易”Compass AI軟件平臺(tái),通過(guò)“軟硬一體”的協(xié)同設(shè)計(jì),讓開(kāi)發(fā)者從“好用”到“用好”,顯著提升開(kāi)發(fā)部署效率。

 

Compass AI軟件平臺(tái)通過(guò)覆蓋開(kāi)發(fā)全流程的工具鏈、極致的易用性?xún)?yōu)化與開(kāi)放的生態(tài)布局,破解端側(cè)AI開(kāi)發(fā)“適配難、周期長(zhǎng)、門(mén)檻高”的痛點(diǎn)。作為核心工具,平臺(tái)中的NN Compiler(神經(jīng)網(wǎng)絡(luò)編譯器)集成Parser(模型解析)、Optimizer(優(yōu)化器)、GBuilder(生成器)及AIPULLM(大模型運(yùn)行工具),可實(shí)現(xiàn)主流模型的高效轉(zhuǎn)化、自動(dòng)化優(yōu)化與部署配置生成,并具備以下核心能力:

l 廣泛的框架與模型支持:支持超160種算子與270種模型,兼容TensorFlow、ONNX、PyTorch、Hugging Face等主流AI框架,提供開(kāi)箱即用的Model Zoo。

l 創(chuàng)新的Hugging Face模型“一鍵部署”:通過(guò)AIPULLM工具鏈,直接支持Hugging Face格式模型,實(shí)現(xiàn)“一站式”轉(zhuǎn)化與部署,極大降低開(kāi)發(fā)門(mén)檻。

l 先進(jìn)的模型推理優(yōu)化:實(shí)現(xiàn)業(yè)界領(lǐng)先的大模型動(dòng)態(tài)shape支持,高效處理任意長(zhǎng)度輸入序列;同時(shí)提供包括Tensor/Channel/Token Level多樣量化方式,以及GPTQ等大模型主流量化方案,并增加對(duì)LLM/VLM/VLA及MoE等模型的高性能支持,保障推理精度并實(shí)現(xiàn)云到端快速遷移。

l 靈活的開(kāi)發(fā)者賦能:提供多種開(kāi)放接口,支持用戶(hù)模型與自定義算子的開(kāi)發(fā)與調(diào)試;配備豐富的調(diào)試工具與Bit精度軟件仿真平臺(tái),支持多層次白盒開(kāi)發(fā)與性能調(diào)優(yōu),極大簡(jiǎn)化算法移植與部署。

l 全面的系統(tǒng)與異構(gòu)兼容:支持Android、Linux、RTOS、QNX等多種操作系統(tǒng),并通過(guò)TVM/ONNX實(shí)現(xiàn)SoC異構(gòu)計(jì)算,高效調(diào)度CPU、GPU、NPU等計(jì)算資源。

 

安謀科技Arm China積極構(gòu)建開(kāi)放生態(tài),Compass AI軟件平臺(tái)中的Parser、Optimizer、Linux Driver、TVM及內(nèi)部IR格式等核心組件已相繼開(kāi)源,并擁有豐富的調(diào)試工具,可滿(mǎn)足開(kāi)發(fā)者白盒部署需求,且支持更易用的DSL算子編程語(yǔ)言。在此基礎(chǔ)上,平臺(tái)賦予開(kāi)發(fā)者更深度的定制能力:客戶(hù)不僅可以使用平臺(tái)中的Compiler、Debugger或DSL語(yǔ)言開(kāi)發(fā)出自己的自定義算子,也可通過(guò)Parser、Optimizer等工具打造出屬于自己的模型編譯器,從而實(shí)現(xiàn)差異化設(shè)計(jì)與開(kāi)發(fā)效率提升。

 

專(zhuān)為大模型而生:安謀科技發(fā)布"周易"X3 NPU,重塑端側(cè)AI計(jì)算格局 

“周易”NPU Compass AI軟件平臺(tái)

 

不僅如此,安謀科技Arm China技術(shù)團(tuán)隊(duì)還圍繞“周易”X3 NPU IP和Compass AI軟件平臺(tái)的軟硬件協(xié)同進(jìn)行精心設(shè)計(jì)和反復(fù)論證,目標(biāo)是提升客戶(hù)最終落地方案的效率和能效。例如,在“周易”X3 NPU IP的AIFF模塊軟硬件設(shè)計(jì)中,硬件端充分結(jié)合軟件使用場(chǎng)景,通過(guò)增大總線(xiàn)帶寬、增加DMA(直接內(nèi)存訪(fǎng)問(wèn))的outstanding(未處理的指令或數(shù)據(jù)請(qǐng)求)等方式提升數(shù)據(jù)搬運(yùn)、數(shù)據(jù)并行效率,軟件端則針對(duì)硬件特性設(shè)計(jì)專(zhuān)屬使用模式,如對(duì)模型進(jìn)行合理切分以充分發(fā)揮多核并行優(yōu)勢(shì)。

 

專(zhuān)為大模型而生:安謀科技發(fā)布"周易"X3 NPU,重塑端側(cè)AI計(jì)算格局

安謀科技Arm China NPU產(chǎn)品線(xiàn)負(fù)責(zé)人兼首席架構(gòu)師舒浩博士

 

安謀科技Arm China NPU產(chǎn)品線(xiàn)負(fù)責(zé)人兼首席架構(gòu)師舒浩博士認(rèn)為:“‘周易’X3的產(chǎn)品優(yōu)勢(shì),源于通用、靈活、高效且軟硬協(xié)同的系統(tǒng)架構(gòu)設(shè)計(jì),這一設(shè)計(jì)使其兼具廣泛的行業(yè)適用性與靈活的邊端側(cè)AI應(yīng)用場(chǎng)景匹配能力?!?/p>

 

多場(chǎng)景落地

從無(wú)形IP到AI萬(wàn)象,端側(cè)智能觸手可及

 

新一代“周易”X3 NPU IP將端側(cè)智能的邊界拓展至更廣闊的應(yīng)用場(chǎng)景,面向基礎(chǔ)設(shè)施、智能汽車(chē)、移動(dòng)終端、智能物聯(lián)網(wǎng)四大領(lǐng)域,精準(zhǔn)匹配當(dāng)前爆發(fā)的端側(cè)AI需求,可廣泛應(yīng)用于加速卡、智能座艙、ADAS、具身智能、AI PC、AI手機(jī)、智能網(wǎng)關(guān)、智能IPC等AI設(shè)備:

l 基礎(chǔ)設(shè)施領(lǐng)域:在加速卡場(chǎng)景中,“周易”X3 NPU IP支持CNN與大模型等多樣結(jié)構(gòu)的AI模型高效加速,為數(shù)據(jù)中心及邊緣計(jì)算節(jié)點(diǎn)提供核心算力。

l 智能汽車(chē)領(lǐng)域:“周易”X3 NPU IP同時(shí)賦能智能駕駛與智能座艙:在ADAS系統(tǒng)中,可為自動(dòng)泊車(chē)等輔助駕駛功能提供高性能AI算力支持;在IVI(車(chē)載信息娛樂(lè)系統(tǒng))中,支持基于語(yǔ)音與車(chē)內(nèi)外視頻圖像輸入的智能互動(dòng)。

l 移動(dòng)終端領(lǐng)域:在AI PC、AI手機(jī)上,“周易”X3 NPU IP可實(shí)現(xiàn)超分渲染,提升顯示分辨率,并支持基于大模型的AI Agent應(yīng)用,為用戶(hù)帶來(lái)更智能、更流暢的交互體驗(yàn)。

l 智能物聯(lián)網(wǎng)領(lǐng)域:在智能網(wǎng)關(guān)、智能IPC等設(shè)備中,“周易”X3 NPU IP支持本地AI推理,實(shí)現(xiàn)更快響應(yīng)與更智能的終端體驗(yàn),滿(mǎn)足邊緣設(shè)備對(duì)實(shí)時(shí)性與隱私保護(hù)的高要求。

 

 

“周易”NPU IP系列家族現(xiàn)場(chǎng)demo展示區(qū)

 

此次發(fā)布會(huì)現(xiàn)場(chǎng)系統(tǒng)展示了“周易”NPU產(chǎn)品家族的技術(shù)演進(jìn)與落地成果,生動(dòng)詮釋其如何將無(wú)形的算力轉(zhuǎn)化為觸手可及的智能體驗(yàn)。

l “周易”Z1:算力0.32~3.75 TOPS,賦能AIoT場(chǎng)景,廣泛支持人臉識(shí)別、人臉及人體關(guān)鍵點(diǎn)檢測(cè)和文字識(shí)別等,且已進(jìn)入AI智能音箱等多種產(chǎn)品。

l “周易”Z2/Z3:算力1.25~5 TOPS,面向AIoT、入門(mén)級(jí)座艙等市場(chǎng),支持前視輔助駕駛方案、艙泊一體方案及安全儀表盤(pán)方案,以及圖像超分辨率優(yōu)化等。

l “周易”X1:算力10 TOPS,面向高端AIoT、汽車(chē)座艙等市場(chǎng),支持駕駛員監(jiān)控、乘客監(jiān)控、自動(dòng)泊車(chē)、AVM 360環(huán)視,以及AI圖像降噪等。

l “周易”X2:算力10-30 TOPS,面向高端AIoT、AI PC、AI Pad、手機(jī)等市場(chǎng),現(xiàn)場(chǎng)展示了運(yùn)行Stable Diffusion v1.5的文生圖能力,運(yùn)行CLIP的文搜圖能力,可實(shí)現(xiàn)端側(cè)多模態(tài)AI流暢運(yùn)行。

l “周易”X3:算力8-80 FP8 TFLOPS,面向基礎(chǔ)設(shè)施、智能汽車(chē)、移動(dòng)終端、AIoT等市場(chǎng),現(xiàn)場(chǎng)展示了基于“周易”X3的主流大模型效果,包括運(yùn)行DeepSeek-R1-Distill-Qwen-1.5B模型的文生文AI流暢對(duì)話(huà),運(yùn)行Stable Diffusion v1.5的文生圖效果,運(yùn)行MiniCPM v2.6模型的圖片識(shí)別及圖生文多模態(tài)應(yīng)用等,均展現(xiàn)出優(yōu)異的端側(cè)大模型推理性能。

 

從“周易”Z1的基礎(chǔ)感知到“周易”X3的復(fù)雜認(rèn)知,這一技術(shù)演進(jìn)路徑清晰地表明,端側(cè)AI正在從單一的功能實(shí)現(xiàn),邁向融合多種模型、適應(yīng)動(dòng)態(tài)場(chǎng)景的“全民普及”新階段。“周易”X3 NPU IP的設(shè)計(jì)充分預(yù)判端側(cè)AI的“場(chǎng)景深化”趨勢(shì):以極致算力表現(xiàn)破解“多模型融合”的算力需求,以全算力類(lèi)型并增強(qiáng)浮點(diǎn)運(yùn)算FLOPS適配“精度動(dòng)態(tài)演變”的場(chǎng)景差異,借助軟硬協(xié)同的生態(tài)打造端側(cè)算力底座。

 

專(zhuān)為大模型而生:安謀科技發(fā)布"周易"X3 NPU,重塑端側(cè)AI計(jì)算格局 

“周易”X3 NPU IP新品發(fā)布會(huì)現(xiàn)場(chǎng)

 

“周易”X3 NPU IP的發(fā)布,標(biāo)志著安謀科技Arm China“All in AI”產(chǎn)品戰(zhàn)略的正式開(kāi)啟。安謀科技Arm China以“AI Arm CHINA”為戰(zhàn)略發(fā)展方向,積極響應(yīng)“AI+”行動(dòng)計(jì)劃,持續(xù)深耕技術(shù)領(lǐng)域創(chuàng)新,同時(shí)攜手伙伴共建開(kāi)放生態(tài),加快構(gòu)建國(guó)內(nèi)“AI+”產(chǎn)業(yè)升級(jí)的智能計(jì)算基石,為千行百業(yè)智能化轉(zhuǎn)型提供更強(qiáng)IP“核芯”動(dòng)力。

 

 

安謀科技Arm China

安謀科技Arm China是國(guó)內(nèi)領(lǐng)先的芯片IP設(shè)計(jì)與服務(wù)提供商。作為一家獨(dú)立運(yùn)營(yíng)的合資企業(yè),公司立足本土創(chuàng)新,堅(jiān)持以自研業(yè)務(wù)技術(shù)創(chuàng)新與Arm技術(shù)授權(quán)相配合,為中國(guó)集成電路產(chǎn)業(yè)提供豐富的產(chǎn)品組合和解決方案,賦能中國(guó)智能計(jì)算“芯”生態(tài)。


我愛(ài)方案網(wǎng)


推薦閱讀:

磁保持繼電器技術(shù)全景圖:從脈沖驅(qū)動(dòng)到國(guó)產(chǎn)化突圍

告別EMC噩夢(mèng):集成隔離方案如何降低測(cè)試成本與風(fēng)險(xiǎn)

電源工程師必備:深度解析MOSFET功耗計(jì)算方法論

射頻入門(mén)實(shí)戰(zhàn):ADALM2000實(shí)現(xiàn)Peltz振蕩器設(shè)計(jì)與調(diào)試

安全隔離保障:交流繼電器在控制系統(tǒng)中的關(guān)鍵作用


特別推薦
技術(shù)文章更多>>
技術(shù)白皮書(shū)下載更多>>
熱門(mén)搜索
?

關(guān)閉

?

關(guān)閉