Tất cả bài viết

// Popular Articles

#ai-hardware

#6242026-01-04

DeepSeek V4 chạy mượt trên Huawei Ascend 950: Hào CUDA của Nvidia chính thức nứt

Ai cũng đang nhìn con số 1.6T tham số và giá $1.74/1M token của DeepSeek V4. Nhưng câu chuyện thật sự nằm ở phần cứng: đây là mô hình frontier đầu tiên không lệ thuộc Nvidia top-tier. Huawei Ascend 950 supernode đạt 20ms inference cho V4-Pro — hào compute địa chính trị đang co lại rất nhanh.

deepseek-v4huawei-ascendopen-source-llm

7 phút đọc

#4212025-09-23

Google ra mắt TPU 8t và TPU 8i: chia đôi chip AI cho training và inference

Tại Google Cloud Next 2026, Google giới thiệu thế hệ TPU thứ 8 với hai chip riêng biệt: TPU 8t cho training (121 FP4 exaflops/pod, nhanh gấp 2.8x Ironwood) và TPU 8i cho inference (1,152 chip/pod, tối ưu cho agent swarms). Đây là lần đầu Google tách hai workload này ra phần cứng chuyên biệt.

google-tputpu-8ttpu-8i

7 phút đọc

#3532025-08-20

NVIDIA Vera Rubin NVL72: Jensen vừa nhét cả phòng siêu máy tính AI vào một rack

Tại CES 2026, Jensen Huang công bố Vera Rubin NVL72 chính thức vào sản xuất hàng loạt — 72 GPU Rubin, 288GB HBM4 mỗi GPU, 260 TB/s NVLink, nhanh gấp 5 lần Blackwell và giảm chi phí token xuống 1/10. Đây là lần đầu NVIDIA co-design cả CPU, GPU, mạng, lưu trữ và bảo mật thành một hệ thống duy nhất.

nvidiavera-rubinjensen-huang

7 phút đọc