// Popular Articles

#python-dsl
#8322026-04-11

pyptx ra mắt: viết PTX kernel cho Hopper & Blackwell ngay trong Python

Patrick Toulme vừa ra mắt pyptx — một DSL Python cho phép viết PTX kernel theo nguyên tắc một-câu-lệnh-một-call. Hỗ trợ trực tiếp wgmma, TMA, tcgen05, mbarriers cho Hopper và Blackwell. GEMM đạt 77–78% cuBLAS, RMSNorm 88% HBM3 peak, grouped GEMM nhanh hơn PyTorch ~10 lần.

pyptxnvidia-ptxblackwell
6 phút đọc