// Popular Articles
DeepSeek ra mắt TileKernels: thư viện GPU kernel viết bằng Python, đạp đổ CUTLASS
DeepSeek vừa open-source TileKernels — thư viện kernel cho LLM viết hoàn toàn bằng TileLang (Python DSL), target trực tiếp tile-level của Hopper/Blackwell, bỏ qua CUTLASS. Đã chạy trong production training + inference của DeepSeek.
DeepSeek ra mắt Tile Kernels: thư viện GPU kernel TileLang chạm giới hạn phần cứng
DeepSeek vừa open-source Tile Kernels — bộ GPU kernel viết bằng TileLang cho các pha MoE gating, routing, FP8/FP4 quantization và normalization. DeepSeek tuyên bố các kernel này đã được dùng trong training/inference nội bộ và đạt gần giới hạn lý thuyết về compute intensity cùng memory bandwidth.