接下來我們來看看GIGABYTE AI TOP ATOM的硬體設計,以及NVIDIA DGX作業系統與獨家支援的AI TOP Utility公用程式。
4TB固態硬碟儲存沒煩惱
NVIDIA推出的DGX Spark由先前的Project DIGITS計劃改名而來,NVIDIA也開放多間合作夥伴推出能夠強化散熱設計的客製化機種,筆這次借測的機種為GIGABYTE AI TOP ATOM。
AI TOP ATOM的規格基本上與DGX Spark一致,最大的差異在於它直接將固態硬碟的容量攻頂至4TB,方便使用者儲存更多AI模型或是訓練資料庫。
另一方面,AI TOP ATOM除了與DGX Spark一樣支援所有NVIDIA提供的軟體堆疊之外,也獨家支援AI TOP Utility公用程式,提供方便的系統資訊儀表板、AI模型微調工具,以及大型語言模型(LLM)與圖像生成等AI推論工具。
▲ NVIDIA自家推出的DGX Spark採用與DGX-1超級電腦相近的造型,並縮小至可以放置於桌面上。
▲ GIGABYTE AI TOP ATOM的包裝透露產品定位為個人AI超級電腦,並標示由NVIDIA加速(Accelerated by NVIDIA)。
▲ AI TOP ATOM機身正面有大型散熱進氣口,外觀設計相當低調。
▲ 機身背面則為散熱出風口,左起為電源鍵、Type-C電源輸入、3組USB Type-C、HDMI 2.1a、10 GbE RJ-45乙太網路,ConnectX-7智慧型網路介面卡等端子。
▲ AI TOP ATOM搭配的電源供應器功率高達240 W,採用USB Type-C介面以及Power Delivery 3.1規範。
▲ 右下角的ConnectX-7智慧型網路介面卡採用QSFP介面,具有高達200 Gb/s的超高頻寬,並可用於串接2台主機。
▲ 串接2台DGX Spark之後能夠讓統一系統記憶體容量擴充至256 GB,進而將原本僅支援參數量為200B的模型,擴展至能夠支援405B參數量的模型。
超大記憶體為無可取代的優勢
DGX Spark的一大優勢為搭載Blackwell架構的繪圖處理器(GPU),在軟體層面能夠與NVIDIA生態系統中的個人電腦、伺服器、雲端運算服務相容,因此不但能夠執行相同的AI應用程式,也能將在DGX Spark上開發、測試完成的程式快速部署到上述機器。
另一方面,容量高達128 GB的統一系統記憶體也讓DGX Spark能夠訓練、微調、執行參數量更大的AI模型,提供高於顯示記憶體容量僅有用32 GB的GeForce RTX 5090顯示卡的應用彈性。
(筆者註:一般情況下若記憶體不足以載入模型或是對應檔案,將會出現稱為Out of Memory的錯誤而導致完全無法完成工作,而不是僅是效能降低而已。)
▲ NVIDIA分析AI發展的趨勢與突破包含更大的模型與資料庫、模型微調、模型量化與修剪、多模態模型、推理式模型、以及代理式AI。
▲ DGX Spark系列產品具有完整的開發環境與軟體堆疊,能夠支援多數主流模型、應用程式、運算框架。
▲ DGX Spark適合應用於開發AI應用程式、微調模型、AI推論運算、資料科學、機器人、電腦視覺、視覺語言模型等應用。
▲ DGX Spark也支援Cursor、VS Code、AI Workbench等多數熱門開發環境,編譯的程式能夠直接相容於Blackwell架設雲端運算主機。
▲ DGX Spark搭載容量高達128 GB的統一系統記憶體,更適合用來微調模型。舉例來說微調FLUX 12B模型將佔用近110 GB記憶體。
▲DGX Spark也能適合AI推論運算,例如執行Cosmos Reason1視覺語言模型。
▲ 大容量統一系統記憶體對AI圖像生成也很有幫助,例如例用FLUX1 .Dev 12B模型(FP16資料類型)生成1K解析度圖像將佔用近35 GB記憶體,超過GeForce RTX 5090顯示卡的32 GB。
▲ NVIDIA也提供了多項DGX Spark的效能數據。
筆者將於下篇文章中介紹GIGABYTE提供的AI TOP Utility公用程式,並進行大型語言模型推論實際操作,請讀者參考下方全文目錄連結繼續閱讀。
(回到系列全文目錄 )