#8322026-04-11
pyptx ra mắt: viết PTX kernel cho Hopper & Blackwell ngay trong Python
Patrick Toulme vừa ra mắt pyptx — một DSL Python cho phép viết PTX kernel theo nguyên tắc một-câu-lệnh-một-call. Hỗ trợ trực tiếp wgmma, TMA, tcgen05, mbarriers cho Hopper và Blackwell. GEMM đạt 77–78% cuBLAS, RMSNorm 88% HBM3 peak, grouped GEMM nhanh hơn PyTorch ~10 lần.