// Popular Articles

#tile-kernels
#6332026-01-09

DeepSeek ra mắt TileKernels: thư viện GPU kernel viết bằng Python, đạp đổ CUTLASS

DeepSeek vừa open-source TileKernels — thư viện kernel cho LLM viết hoàn toàn bằng TileLang (Python DSL), target trực tiếp tile-level của Hopper/Blackwell, bỏ qua CUTLASS. Đã chạy trong production training + inference của DeepSeek.

deepseektile-kernelstilelang
6 phút đọc
#5012025-11-02

DeepSeek ra mắt Tile Kernels: thư viện GPU kernel TileLang chạm giới hạn phần cứng

DeepSeek vừa open-source Tile Kernels — bộ GPU kernel viết bằng TileLang cho các pha MoE gating, routing, FP8/FP4 quantization và normalization. DeepSeek tuyên bố các kernel này đã được dùng trong training/inference nội bộ và đạt gần giới hạn lý thuyết về compute intensity cùng memory bandwidth.

deepseektile-kernelstilelang
7 phút đọc