#962025-04-13
NVIDIA Dynamo 1.0: Hệ điều hành cho AI factory, scale LLM inference đến hàng nghìn GPU
NVIDIA Dynamo là framework inference phân tán datacenter-scale, kế nhiệm Triton, vừa GA 1.0 ngày 16/03/2026. Disaggregated prefill/decode, KV-aware routing và dynamic GPU scheduling đẩy throughput Blackwell lên 7x — và DeepSeek-R1 trên GB200 NVL72 lên 30x token/GPU.