在看完Snapdragon X2平台的CPU與GPU解析之後,我們一起來看看同樣整合於SoC內的NPU,它以高達80 TOPS的AI運算效能成為現今最強的整合式NPU。在看完Snapdragon X2平台的CPU與GPU解析之後,我們一起來看看同樣整合於SoC內的NPU,它以高達80 TOPS的AI運算效能成為現今最強的整合式NPU。 代際效能成長78% Snapdragon X2平台內建的Hexagon NPU(神經處理器)具有高達80 TOPS的AI運算效能,不但高於現在已推出的AMD Ryzen AI9 HX 375則為的55 TOPS,以及Intel Core Ultra 9 288V的48 TOPS,也高於Apple M4 Max的38 TOPS,成為當今AI運算效最強的整合式。 延伸閱讀:Intel Panther Lake處理器NPU詳解,效能小幅提升、尺寸驟降40%AMD Tech Day 2024(三):XDNA 2 AI運算架構解析,Block FP16資料類型運算效率倍增NPU有什麼用?AMD說明處理器內建Ryzen AI加速單元的好處 Qualcomm為了改進Hexagon NPU的效能表現,分析超過300種不同AI模型運算過程中所占用的資源,並改進架構設計以達到更平均的純量、向量、矩陣運算以及記憶體資源分配,達到提升整體效能表現的成果。 筆者將Qualcomm於Snapdragon Compute Architecture Deep Dive 2025大會的說明整理於下。 ▲ Snapdragon X2平台內建的Hexagon NPU具有高達80 TOPS的AI運算效能,較前代產品提高78%。 ▲ Qualcomm表示Hexagon NPU能夠滿足代理式AI與多樣AI應用程式的許用需求。 ▲ 回顧Hexagon的發展史,它在2004年應用於Hexagon DSP(Digital Signal Processor,數位訊號處理器),能夠加速乘積累加運算(Multiply Accumulate,MAC)。而衍生的Hexagon處理器則加強影像方面運算能力,並於2019年進化為Hexagon NPU,進一步強化機器學習運算能力。 ▲ 在2019年改名為Hexagon NPU之後,運算單元的規模也是逐代擴大,滿足更複雜的運算需求。 ▲ Qualcomm分析超過300種不同AI模型對純量、向量、矩陣運算以及記憶體的資源需求,以利改進NPU架構能夠平均分配純量、向量運算以及直接存取記憶體(DMA)頻寬等資源,進而提升整體效能。 ▲ Hexagon NPU的純量引擎透過多執行緒技術(SMT)降低運算延遲,並藉由多層級分枝預測、使用者模式權限虛擬DMA、硬體資料同步等功能,以降低運算虛耗。 ▲ Hexagon NPU的純量引擎具有12條執行緒,具有與前代NPU相比2倍的記憶體頻寬,並具備64 bit DMA定址能力。 ▲ 上述這些改進能夠讓Snapdragon X2平台的Hexagon NPU較前代產品的純量運算吞吐量提升143%。 ▲ 受益於快取記憶體與DMA,讓Hexagon NPU的匯流排頻寬較前代提升127%。 ▲ Hexagon NPU的向量引擎具有8條執行緒,每組執行緒具有4組SIMD(Single Instruction Multiple Data,單指令流多資料流)指令窗口,新增支援FP8、BF16等資料類型。 ▲ Snapdragon X2平台的Hexagon NPU較前代產品的向量運算吞吐量提升143%。 ▲ 矩陣運算單元支援2 bit格式的資料權重與FP8、BF16等資料類型,此外也支援融合激勵函數與深度捲積等運算的硬體加速,並具有獨立電源迴路以在閒置時節省電力。 ▲ Snapdragon X2平台的Hexagon NPU較前代產品的矩陣運算吞吐量提升78%。 NPU效能對照 Qualcomm為Snapdragon X2平台提供了完整的軟體堆疊,讓多種AI應用程式、執行環境、運算框架能夠分配到最適合的處理器(CPU)、繪圖處理器(GPU)或是NPU等運算單元,達到提供最佳效能同時兼顧電池續航力的效果。 筆者也將Qualcomm提供的官方效能數據整理於下。 ▲ Snapdragon X2平台的軟體堆疊可以將Phi、Llama、GPT、Gemini、Stable Diffusion等多種AI軟體,並調用CPU、GPU、NPU等單元執行運算。 ▲ 利用CPU執行AI運算的特色為具有較快的反應速度,適合文字辨識、Windows Hello偵測,GPU效能較高,適合用於生成式AI。NPU則有出色效能與電力效率,適合持續性AI負載、代理式AI、視訊會議逐字稿等等。 ▲ 以開啟1組上下文長度為1024個字詞的3B參數量大型語言模型(LLM)的AI代理為例,大約需要6 TOPS才能滿足流暢運作的需求。若將負載提高後,Snapdragon X2平台的80 TOPS AI運算效能能夠應付4組7B參數量的AI代理(需72 TOPS)。 ▲ Snapdragon X2 Elite Extreme的Procyon AI效能成績大幅領先Intel Core Ultra 9 288V、Core Ultra 9 285H等競爭對手的處理器,電力效率(每瓦電力獲得的分數)也領先許多。 ▲ Snapdragon X2 Elite Extreme與前代Snapdragon X Elite相比,在同樣消耗5 W電力的情況下,執行EDSR超解析度圖像升頻的效能大約成長60%。 ▲ 在消耗相同電力的前提下,不同的資料類型或量化最佳化具有不同的效能表現。利如從FP16改為INT8或W4A16(INT4的特化量化,代表4 bit Weight與16 bit Activation混合量化)可提升4倍運算表現,若進一步改為W4A8可再提升2倍效能。 ▲ Qualcomm整理競爭對手處理器內建NPU的AI運算效能,自家Snapdragon X2 Elite Extreme達到80 TOPS,排名第2的AMD Ryzen AI9 HX 375則為55 TOPS。 ▲ 在實際進行Procyon AI電腦視覺效能測試時,Snapdragon X2 Elite Extreme大幅領先競爭對手,領先第2名的Apple M4約95.71%。 ▲ Snapdragon X2 Elite Extreme在Geekbench AI 1.5也能領先Apple M4約69.78%。AMD Ryzen AI9 HX 370無法完成測試。 ▲ Procyon AI電腦視覺效能測的電力效率也是由Snapdragon X2 Elite Extreme大幅領先,可以超前Intel Core Ultra 9 285H達3.8倍。 ▲ Hexagon NPU的特色簡表。 首批搭載Snapdragon X2平台的筆記型電腦預計將於2026年上半年推出,屆時我們就有機會一窺新一代Windows on Snapdragon的實際效能與相容性表現。更多Snapdragon X 2平台詳細解說請參考Snapdragon Compute Architecture Deep Dive 2025系列報導。 (回到系列全文目錄)加入T客邦Facebook粉絲團在看完Snapdragon X2平台的CPU與GPU解析之後,我們一起來看看同樣整合於SoC內的NPU,它以高達80 TOPS的AI運算效能成為現今最強的整合式NPU。在看完Snapdragon X2平台的CPU與GPU解析之後,我們一起來看看同樣整合於SoC內的NPU,它以高達80 TOPS的AI運算效能成為現今最強的整合式NPU。 代際效能成長78% Snapdragon X2平台內建的Hexagon NPU(神經處理器)具有高達80 TOPS的AI運算效能,不但高於現在已推出的AMD Ryzen AI9 HX 375則為的55 TOPS,以及Intel Core Ultra 9 288V的48 TOPS,也高於Apple M4 Max的38 TOPS,成為當今AI運算效最強的整合式。 延伸閱讀:Intel Panther Lake處理器NPU詳解,效能小幅提升、尺寸驟降40%AMD Tech Day 2024(三):XDNA 2 AI運算架構解析,Block FP16資料類型運算效率倍增NPU有什麼用?AMD說明處理器內建Ryzen AI加速單元的好處 Qualcomm為了改進Hexagon NPU的效能表現,分析超過300種不同AI模型運算過程中所占用的資源,並改進架構設計以達到更平均的純量、向量、矩陣運算以及記憶體資源分配,達到提升整體效能表現的成果。 筆者將Qualcomm於Snapdragon Compute Architecture Deep Dive 2025大會的說明整理於下。 ▲ Snapdragon X2平台內建的Hexagon NPU具有高達80 TOPS的AI運算效能,較前代產品提高78%。 ▲ Qualcomm表示Hexagon NPU能夠滿足代理式AI與多樣AI應用程式的許用需求。 ▲ 回顧Hexagon的發展史,它在2004年應用於Hexagon DSP(Digital Signal Processor,數位訊號處理器),能夠加速乘積累加運算(Multiply Accumulate,MAC)。而衍生的Hexagon處理器則加強影像方面運算能力,並於2019年進化為Hexagon NPU,進一步強化機器學習運算能力。 ▲ 在2019年改名為Hexagon NPU之後,運算單元的規模也是逐代擴大,滿足更複雜的運算需求。 ▲ Qualcomm分析超過300種不同AI模型對純量、向量、矩陣運算以及記憶體的資源需求,以利改進NPU架構能夠平均分配純量、向量運算以及直接存取記憶體(DMA)頻寬等資源,進而提升整體效能。 ▲ Hexagon NPU的純量引擎透過多執行緒技術(SMT)降低運算延遲,並藉由多層級分枝預測、使用者模式權限虛擬DMA、硬體資料同步等功能,以降低運算虛耗。 ▲ Hexagon NPU的純量引擎具有12條執行緒,具有與前代NPU相比2倍的記憶體頻寬,並具備64 bit DMA定址能力。 ▲ 上述這些改進能夠讓Snapdragon X2平台的Hexagon NPU較前代產品的純量運算吞吐量提升143%。 ▲ 受益於快取記憶體與DMA,讓Hexagon NPU的匯流排頻寬較前代提升127%。 ▲ Hexagon NPU的向量引擎具有8條執行緒,每組執行緒具有4組SIMD(Single Instruction Multiple Data,單指令流多資料流)指令窗口,新增支援FP8、BF16等資料類型。 ▲ Snapdragon X2平台的Hexagon NPU較前代產品的向量運算吞吐量提升143%。 ▲ 矩陣運算單元支援2 bit格式的資料權重與FP8、BF16等資料類型,此外也支援融合激勵函數與深度捲積等運算的硬體加速,並具有獨立電源迴路以在閒置時節省電力。 ▲ Snapdragon X2平台的Hexagon NPU較前代產品的矩陣運算吞吐量提升78%。 NPU效能對照 Qualcomm為Snapdragon X2平台提供了完整的軟體堆疊,讓多種AI應用程式、執行環境、運算框架能夠分配到最適合的處理器(CPU)、繪圖處理器(GPU)或是NPU等運算單元,達到提供最佳效能同時兼顧電池續航力的效果。 筆者也將Qualcomm提供的官方效能數據整理於下。 ▲ Snapdragon X2平台的軟體堆疊可以將Phi、Llama、GPT、Gemini、Stable Diffusion等多種AI軟體,並調用CPU、GPU、NPU等單元執行運算。 ▲ 利用CPU執行AI運算的特色為具有較快的反應速度,適合文字辨識、Windows Hello偵測,GPU效能較高,適合用於生成式AI。NPU則有出色效能與電力效率,適合持續性AI負載、代理式AI、視訊會議逐字稿等等。 ▲ 以開啟1組上下文長度為1024個字詞的3B參數量大型語言模型(LLM)的AI代理為例,大約需要6 TOPS才能滿足流暢運作的需求。若將負載提高後,Snapdragon X2平台的80 TOPS AI運算效能能夠應付4組7B參數量的AI代理(需72 TOPS)。 ▲ Snapdragon X2 Elite Extreme的Procyon AI效能成績大幅領先Intel Core Ultra 9 288V、Core Ultra 9 285H等競爭對手的處理器,電力效率(每瓦電力獲得的分數)也領先許多。 ▲ Snapdragon X2 Elite Extreme與前代Snapdragon X Elite相比,在同樣消耗5 W電力的情況下,執行EDSR超解析度圖像升頻的效能大約成長60%。 ▲ 在消耗相同電力的前提下,不同的資料類型或量化最佳化具有不同的效能表現。利如從FP16改為INT8或W4A16(INT4的特化量化,代表4 bit Weight與16 bit Activation混合量化)可提升4倍運算表現,若進一步改為W4A8可再提升2倍效能。 ▲ Qualcomm整理競爭對手處理器內建NPU的AI運算效能,自家Snapdragon X2 Elite Extreme達到80 TOPS,排名第2的AMD Ryzen AI9 HX 375則為55 TOPS。 ▲ 在實際進行Procyon AI電腦視覺效能測試時,Snapdragon X2 Elite Extreme大幅領先競爭對手,領先第2名的Apple M4約95.71%。 ▲ Snapdragon X2 Elite Extreme在Geekbench AI 1.5也能領先Apple M4約69.78%。AMD Ryzen AI9 HX 370無法完成測試。 ▲ Procyon AI電腦視覺效能測的電力效率也是由Snapdragon X2 Elite Extreme大幅領先,可以超前Intel Core Ultra 9 285H達3.8倍。 ▲ Hexagon NPU的特色簡表。 首批搭載Snapdragon X2平台的筆記型電腦預計將於2026年上半年推出,屆時我們就有機會一窺新一代Windows on Snapdragon的實際效能與相容性表現。更多Snapdragon X 2平台詳細解說請參考Snapdragon Compute Architecture Deep Dive 2025系列報導。 (回到系列全文目錄)加入T客邦Facebook粉絲團

Qualcomm Snapdragon X2 NPU效能稱霸!80 TOPS輾壓群雄,AI筆電2026登場

2025/12/04 15:00

在看完Snapdragon X2平台的CPU與GPU解析之後,我們一起來看看同樣整合於SoC內的NPU,它以高達80 TOPS的AI運算效能成為現今最強的整合式NPU。

代際效能成長78%

Snapdragon X2平台內建的Hexagon NPU(神經處理器)具有高達80 TOPS的AI運算效能,不但高於現在已推出的AMD Ryzen AI9 HX 375則為的55 TOPS,以及Intel Core Ultra 9 288V的48 TOPS,也高於Apple M4 Max的38 TOPS,成為當今AI運算效最強的整合式。

Qualcomm為了改進Hexagon NPU的效能表現,分析超過300種不同AI模型運算過程中所占用的資源,並改進架構設計以達到更平均的純量、向量、矩陣運算以及記憶體資源分配,達到提升整體效能表現的成果。

筆者將Qualcomm於Snapdragon Compute Architecture Deep Dive 2025大會的說明整理於下。

Snapdragon X2平台內建的Hexagon NPU具有高達80 TOPS的AI運算效能,較前代產品提高78%。

Qualcomm表示Hexagon NPU能夠滿足代理式AI與多樣AI應用程式的許用需求。

回顧Hexagon的發展史,它在2004年應用於Hexagon DSP(Digital Signal Processor,數位訊號處理器),能夠加速乘積累加運算(Multiply Accumulate,MAC)。而衍生的Hexagon處理器則加強影像方面運算能力,並於2019年進化為Hexagon NPU,進一步強化機器學習運算能力。

在2019年改名為Hexagon NPU之後,運算單元的規模也是逐代擴大,滿足更複雜的運算需求。

Qualcomm分析超過300種不同AI模型對純量、向量、矩陣運算以及記憶體的資源需求,以利改進NPU架構能夠平均分配純量、向量運算以及直接存取記憶體(DMA)頻寬等資源,進而提升整體效能。

Hexagon NPU的純量引擎透過多執行緒技術(SMT)降低運算延遲,並藉由多層級分枝預測、使用者模式權限虛擬DMA、硬體資料同步等功能,以降低運算虛耗。

Hexagon NPU的純量引擎具有12條執行緒,具有與前代NPU相比2倍的記憶體頻寬,並具備64 bit DMA定址能力。

上述這些改進能夠讓Snapdragon X2平台的Hexagon NPU較前代產品的純量運算吞吐量提升143%。

受益於快取記憶體與DMA,讓Hexagon NPU的匯流排頻寬較前代提升127%。

Hexagon NPU的向量引擎具有8條執行緒,每組執行緒具有4組SIMD(Single Instruction Multiple Data,單指令流多資料流)指令窗口,新增支援FP8、BF16等資料類型。

Snapdragon X2平台的Hexagon NPU較前代產品的向量運算吞吐量提升143%。

矩陣運算單元支援2 bit格式的資料權重與FP8、BF16等資料類型,此外也支援融合激勵函數與深度捲積等運算的硬體加速,並具有獨立電源迴路以在閒置時節省電力。

Snapdragon X2平台的Hexagon NPU較前代產品的矩陣運算吞吐量提升78%。

NPU效能對照

Qualcomm為Snapdragon X2平台提供了完整的軟體堆疊,讓多種AI應用程式、執行環境、運算框架能夠分配到最適合的處理器(CPU)、繪圖處理器(GPU)或是NPU等運算單元,達到提供最佳效能同時兼顧電池續航力的效果。

筆者也將Qualcomm提供的官方效能數據整理於下。

Snapdragon X2平台的軟體堆疊可以將Phi、Llama、GPT、Gemini、Stable Diffusion等多種AI軟體,並調用CPU、GPU、NPU等單元執行運算。

利用CPU執行AI運算的特色為具有較快的反應速度,適合文字辨識、Windows Hello偵測,GPU效能較高,適合用於生成式AI。NPU則有出色效能與電力效率,適合持續性AI負載、代理式AI、視訊會議逐字稿等等。

以開啟1組上下文長度為1024個字詞的3B參數量大型語言模型(LLM)的AI代理為例,大約需要6 TOPS才能滿足流暢運作的需求。若將負載提高後,Snapdragon X2平台的80 TOPS AI運算效能能夠應付4組7B參數量的AI代理(需72 TOPS)。

Snapdragon X2 Elite Extreme的Procyon AI效能成績大幅領先Intel Core Ultra 9 288V、Core Ultra 9 285H等競爭對手的處理器,電力效率(每瓦電力獲得的分數)也領先許多。

Snapdragon X2 Elite Extreme與前代Snapdragon X Elite相比,在同樣消耗5 W電力的情況下,執行EDSR超解析度圖像升頻的效能大約成長60%。

在消耗相同電力的前提下,不同的資料類型或量化最佳化具有不同的效能表現。利如從FP16改為INT8或W4A16(INT4的特化量化,代表4 bit Weight與16 bit Activation混合量化)可提升4倍運算表現,若進一步改為W4A8可再提升2倍效能。

Qualcomm整理競爭對手處理器內建NPU的AI運算效能,自家Snapdragon X2 Elite Extreme達到80 TOPS,排名第2的AMD Ryzen AI9 HX 375則為55 TOPS。

在實際進行Procyon AI電腦視覺效能測試時,Snapdragon X2 Elite Extreme大幅領先競爭對手,領先第2名的Apple M4約95.71%。

Snapdragon X2 Elite Extreme在Geekbench AI 1.5也能領先Apple M4約69.78%。AMD Ryzen AI9 HX 370無法完成測試。

Procyon AI電腦視覺效能測的電力效率也是由Snapdragon X2 Elite Extreme大幅領先,可以超前Intel Core Ultra 9 285H達3.8倍。

Hexagon NPU的特色簡表。

首批搭載Snapdragon X2平台的筆記型電腦預計將於2026年上半年推出,屆時我們就有機會一窺新一代Windows on Snapdragon的實際效能與相容性表現。更多Snapdragon X 2平台詳細解說請參考Snapdragon Compute Architecture Deep Dive 2025系列報導。

回到系列全文目錄

免責聲明: 本網站轉載的文章均來源於公開平台,僅供參考。這些文章不代表 MEXC 的觀點或意見。所有版權歸原作者所有。如果您認為任何轉載文章侵犯了第三方權利,請聯絡 [email protected] 以便將其刪除。MEXC 不對轉載文章的及時性、準確性或完整性作出任何陳述或保證,並且不對基於此類內容所採取的任何行動或決定承擔責任。轉載材料僅供參考,不構成任何商業、金融、法律和/或稅務決策的建議、認可或依據。

您可能也會喜歡

SEC隱私會議警告:金融法規已成區塊鏈監獄,首要重點保障人權與技術中立

SEC隱私會議警告:金融法規已成區塊鏈監獄,首要重點保障人權與技術中立

SEC 首度在年終圓桌強調「隱私應為常態」,主席 Atkins 警告區塊鏈恐成金融全景監獄,顯示美國監管哲學正 […] 〈SEC隱私會議警告:金融法規已成區塊鏈監獄,首要重點保障人權與技術中立〉這篇文章最早發佈於動區BlockTempo《動區動趨-最具影響力的區塊鏈新聞媒體》。
分享
Blocktempo2025/12/16 11:57
Tether 以 3 億美元和解金解決 Celsius 訴訟案

Tether 以 3 億美元和解金解決 Celsius 訴訟案

區塊鏈復原投資聯盟(The Blockchain Recovery Investment Consortium,BRIC),一個由GXD Labs和VanEck合作成立的夥伴關係,週二宣布了Celsius破產案的重大進展。Tether(USDT)已同意向這家加密貸款機構的破產財產支付一筆巨額款項,這是去年啟動的對抗程序的結果。 Tether解決數十億美元訴訟 這項和解標誌著圍繞Celsius持續法律糾紛的重要里程碑,Celsius於2022年7月申請破產。Celsius此前曾指控Tether處理不當抵押品和清算,索賠39,542 BTC(當時約43億美元)以及額外1億美元的損害賠償,這構成了他們最大的第三方索賠。 相關閱讀:Bitcoin重置完成?Ostium預見爆發性上漲至133,000美元 正如Bitcoinist先前報導,Celsius聲稱Tether的行為體現了一個更廣泛的「利用美國加密貨幣市場的計劃」,他們認為這一立場可以支持本案的管轄權。針對這些指控,Tether將訴訟描述為「敲詐」,聲稱Celsius有責任在當時Bitcoin價格波動的情況下提供額外抵押品。Tether堅持認為,Celsius的管理不善不應導致他們承擔不當成本。 Celsius破產債權人獲得重大回報 最終,這項和解允許Tether以Celsius最初索賠金額的一小部分解決此事,預計將收回近3億美元,為參與破產程序的債權人提供了顯著回報。Tether首席執行官Paolo Ardoino也在社交媒體網站X(前身為Twitter)上評論了這項和解,表示:「Tether很高興已就與Celsius破產相關的所有問題達成和解。」 相關閱讀:數十年醞釀:加密貨幣交易所預測Shiba Inu價格何時將達到0.01美元 GXD Labs管理合夥人David Proman也對解決方案表示滿意。他表示:「我們很高興已解決Celsius的對抗程序和針對Tether的相關索賠。」 特色圖片來自DALL-E,圖表來自TradingView.com
分享
NewsBTC2025/10/15 03:22
信用卡 DCC 動態貨幣轉換是什麼?加密卡如何避開陷阱?

信用卡 DCC 動態貨幣轉換是什麼?加密卡如何避開陷阱?

信用卡 DCC 動態貨幣轉換 是什麼 DCC(Dynamic Currency Conversion)原本是一 […]
分享
Grenade2025/12/16 12:30