// Popular Articles

#qwen3-5
#4452025-10-05

Perplexity hậu-huấn luyện Qwen3.5 bằng SFT+RL: vượt GPT-5.4 trên FRAMES với chi phí rẻ hơn 4 lần

Perplexity công bố pipeline hậu-huấn luyện hai giai đoạn (SFT → GRPO) cho các mô hình search-augmented. Dựa trên Qwen3.5-397B-A17B, bản SFT-RL đạt 73.9% FRAMES ở ngân sách 4 tool call, vượt GPT-5.4 (67.8%) và Sonnet 4.6 (62.4%) với chi phí chỉ 2.0 cent/truy vấn — rẻ hơn 4× đến 7.5×.

perplexityqwen3-5post-training
7 phút đọc
#2462025-06-27

Kimi K2.6 tự viết inference engine bằng Zig cho Qwen3.5, đánh bại LM Studio 20%

Moonshot AI cho K2.6 chạy tự do 12 giờ trên Mac: đọc, đo, sửa, thử lại — 14 vòng, 4000+ tool call. Kết quả: engine Zig handwritten-by-LLM nhanh hơn LM Studio khoảng 20% khi inference Qwen3.5-0.8B.

kimi-k2-6moonshot-aiqwen3-5
6 phút đọc