// Popular Articles
DeepSeek V4 chạy mượt trên Huawei Ascend 950: Hào CUDA của Nvidia chính thức nứt
Ai cũng đang nhìn con số 1.6T tham số và giá $1.74/1M token của DeepSeek V4. Nhưng câu chuyện thật sự nằm ở phần cứng: đây là mô hình frontier đầu tiên không lệ thuộc Nvidia top-tier. Huawei Ascend 950 supernode đạt 20ms inference cho V4-Pro — hào compute địa chính trị đang co lại rất nhanh.
Google ra mắt TPU 8t và TPU 8i: chia đôi chip AI cho training và inference
Tại Google Cloud Next 2026, Google giới thiệu thế hệ TPU thứ 8 với hai chip riêng biệt: TPU 8t cho training (121 FP4 exaflops/pod, nhanh gấp 2.8x Ironwood) và TPU 8i cho inference (1,152 chip/pod, tối ưu cho agent swarms). Đây là lần đầu Google tách hai workload này ra phần cứng chuyên biệt.
NVIDIA Vera Rubin NVL72: Jensen vừa nhét cả phòng siêu máy tính AI vào một rack
Tại CES 2026, Jensen Huang công bố Vera Rubin NVL72 chính thức vào sản xuất hàng loạt — 72 GPU Rubin, 288GB HBM4 mỗi GPU, 260 TB/s NVLink, nhanh gấp 5 lần Blackwell và giảm chi phí token xuống 1/10. Đây là lần đầu NVIDIA co-design cả CPU, GPU, mạng, lưu trữ và bảo mật thành một hệ thống duy nhất.