AMD ra mắt mini PC AI 128GB unified memory, giá $3.999 đối đầu NVIDIA DGX Spark

TL;DR

AMD ra mắt mini PC AI tự thiết kế tên Ryzen AI Halo tại Mỹ tháng 6/2026, giá khởi điểm $3.999.
Trang bị SoC Ryzen AI Max+ 395 (codename Strix Halo) với 16 nhân Zen 5, GPU Radeon 8060S RDNA 3.5 40 CU, NPU XDNA 2 đạt 50 TOPS.
128GB LPDDR5X-8000 unified memory, cho phép load model lên tới 200 tỷ tham số ngay trên máy, không cần internet.
Rẻ hơn NVIDIA DGX Spark ($4.699) khoảng $700 và là lựa chọn hiếm hoi có cả Windows 11 lẫn Linux trong phân khúc này.
Pre-cài ROCm 7.2.2, LM Studio, ComfyUI, VS Code, Ollama - AMD nói "từ bật máy đến sinh token chỉ vài phút".

AMD Ryzen AI Halo mini PC 128GB đối đầu NVIDIA DGX Spark — AMD Ryzen AI Halo - mini PC 128GB unified memory đối đầu trực diện NVIDIA DGX Spark.

Halo Box - mini PC AMD tự đóng cho local AI

Lâu nay phần cứng AI tại bàn làm việc nghiêng hẳn về NVIDIA, từ workstation RTX cho đến DGX Spark - chiếc mini PC GB10 mà NVIDIA tung ra như một "AI desk lamp" cho developer. Giờ AMD nhảy vào sân chơi này với sản phẩm tự thiết kế nội bộ gọi là Ryzen AI Halo (tên nội bộ "Halo Box"), nhắm thẳng phân khúc local AI development.

Máy dùng SoC Ryzen AI Max+ 395 - chip Strix Halo mà cộng đồng đã chờ cả năm. Khác với CPU desktop thông thường, Strix Halo gom CPU + GPU mạnh + NPU + bộ nhớ thống nhất vào một SoC duy nhất, giống triết lý mà Apple đã chứng minh hiệu quả với M-series. Kích thước máy 149 × 149 × 43 mm, gần bằng Mac mini.

Cấu hình chi tiết

SoC: Ryzen AI Max+ 395 - 16 nhân Zen 5, 32 thread, base 3,0 GHz, boost 5,1 GHz, TDP mặc định 55W.
GPU tích hợp: Radeon 8060S kiến trúc RDNA 3.5, 40 compute unit. Có thể phân bổ tới 96GB VRAM qua Variable Graphics Memory.
NPU: XDNA 2, hiệu năng 50 TOPS dành riêng cho inference nhẹ và workload sparse.
RAM: 128GB LPDDR5X-8000 hàn sẵn, unified giữa CPU/GPU/NPU.
Kết nối: Wi-Fi 7, Bluetooth 5.4, 1 cổng Ethernet 10GbE, 4 cổng USB-C (1 dành cấp nguồn), 1 HDMI 2.1b.
OS: Windows 11 Pro hoặc Linux, cùng phần cứng.

Điểm đáng chú ý: NVIDIA DGX Spark chỉ chạy Linux, còn Halo Box mở cửa cho cả người làm Windows tooling - một lợi thế lớn với team enterprise vốn không muốn rời hệ sinh thái Microsoft.

So sánh trực tiếp với NVIDIA DGX Spark

Bảng so sánh AMD Ryzen AI Halo và NVIDIA DGX Spark — So sánh thông số AMD Ryzen AI Halo vs NVIDIA DGX Spark.

Tiêu chí	AMD Ryzen AI Halo	NVIDIA DGX Spark (GB10)
Giá khởi điểm	$3.999	$4.699
Bộ nhớ thống nhất	128GB LPDDR5X-8000	128GB LPDDR5X
Hệ điều hành	Windows 11 Pro hoặc Linux	Chỉ Linux
NPU riêng	XDNA 2 - 50 TOPS	Không có
SoC	Zen 5 + RDNA 3.5	Grace + Blackwell
Software stack	ROCm 7.2.2	CUDA + NIM

AMD tự công bố Halo Box nhanh hơn trung bình 4 lần so với Apple Mac mini M4 Pro trên các workload AI. Con số do hãng tự đưa và phụ thuộc model lẫn quantization, nên cần benchmark độc lập xác nhận. Dù vậy, chỉ riêng việc có 128GB unified ở giá rẻ hơn DGX Spark đã đủ để các team nghiên cứu local LLM cân nhắc nghiêm túc.

Gần 30 mini PC Strix Halo khác cùng ra trong 8 tháng

Halo Box là phiên bản AMD tự đóng để định vị giá tham chiếu, nhưng OEM thì đã đi trước. Trong 8 tháng kể từ khi nền tảng Strix Halo công bố, gần 30 model mini PC đã lên kệ:

Beelink: bản rẻ nhất, $2.399 (cấu hình RAM/SSD thấp hơn).
Corsair: $2.499.
Framework Desktop: $2.851 - lựa chọn ưu thích nếu bạn theo trường phái modular.
GMKtec EVO-X2: khoảng $3.000.
HP Z2 Mini: $3.734 - định vị enterprise.
MINIX: $3.810 - thiết kế đẹp, gần ngang giá AMD.

Điều này có nghĩa: nếu bạn không cần phần mềm AMD pre-cài, có thể mua OEM rẻ hơn 1.000-1.600 USD cho cùng SoC. Đổi lại, bản AMD đảm bảo phần mềm tối ưu nhất ngày đầu và driver được hãng test trực tiếp.

Phần mềm sẵn sàng - không cần lắp ráp

Halo Box ship kèm ROCm 7.2.2 - bản mới nhất của AMD compute stack - cùng các công cụ AI phổ biến đã được tối ưu sẵn: LM Studio, ComfyUI, VS Code, Ollama. AMD nói có "day-zero support" cho các model lớn như GPT-OSS, FLUX.2, SDXL, nghĩa là model phát hành đến đâu chạy được tới đó mà không cần chỉnh tay.

Với người đang dùng Mac M-series cho local LLM, đây là lợi điểm rõ rệt: Apple Silicon chạy MLX tốt nhưng vẫn vướng vài giới hạn về fine-tune và ecosystem PyTorch. Halo Box vừa có ROCm vừa có Vulkan backend cho LM Studio/Ollama, đồng nghĩa hầu hết workflow inference hiện tại đều "plug and play".

Ai nên xuống tiền

Developer làm coding assistant local: 128GB unified đủ để chạy quantized 70-120B model với context dài, không phải cắt model nhỏ.
Team xử lý dữ liệu nhạy cảm: tài chính, y tế, pháp lý - cần inference hoàn toàn offline, không gửi token ra ngoài.
Researcher prototype agent workflow: chạy nhiều agent đồng thời mà không phụ thuộc rate-limit của API bên ngoài.
Studio sinh ảnh/video AI: GPU 40 CU + 96GB VRAM phân bổ đủ cho SDXL, FLUX và workflow ComfyUI phức tạp.

Hạn chế cần biết trước khi đặt

Một số điểm cần thực tế:

Băng thông LPDDR5X-8000 trên kênh 256-bit chỉ khoảng 256 GB/s - thấp hơn HBM của data-center GPU. Chạy 200B model được nhưng token/s sẽ chậm hơn DGX Spark đáng kể.
Quantization mạnh (Q4 hoặc thấp hơn) gần như bắt buộc cho model 120B+.
ROCm vẫn yếu hơn CUDA về độ chín mảng training, fine-tune lớn.
Bảo hành và sửa chữa SoC hàn sẵn không thân thiện với người tự nâng cấp.

Kết

Halo Box không thay được DGX A100 hay H100 cluster, và cũng không hứa hẹn điều đó. Nhưng ở phân khúc mini AI workstation $3.000-$5.000, AMD vừa cắm cờ thuyết phục: 128GB unified, hai hệ điều hành, software stack sẵn sàng, giá thấp hơn NVIDIA $700. Cuộc đua local LLM 2026 nhờ vậy mà thực sự có hai mâm thay vì độc diễn.

Nguồn

via Tom's Hardware, TweakTown, Wccftech, The Outpost, gagadget, @xiaohu trên X.