GLM-5.2 Đánh Bại Fable 5 trên Design Arena: Mã Nguồn Mở Lần Đầu Giữ Ngôi #1

TL;DR

GLM-5.2 của Z.ai vừa giành vị trí #1 trên Design Arena's single-turn HTML Web Design leaderboard với Elo score 1360 - đánh bại Fable 5, model giữ đỉnh suốt nhiều tháng. Đây là lần đầu tiên một model MIT licensed làm được điều này, với 744B tham số và không có vision capabilities. Giá API chỉ $1.40/$4.40 per 1M tokens - rẻ hơn Fable 5 tới 7-11x.

Design Arena - Tại Sao Kết Quả Này Quan Trọng

Design Arena không phải benchmark tổng hợp thông thường. Đây là leaderboard dựa trên head-to-head human preference - người dùng thực tế so sánh trực tiếp hai website được generate từ cùng một prompt và chọn bên nào tốt hơn. Elo score phản ánh sở thích thực của người dùng, không phải bài test điền chỗ trống.

Fable 5 và dòng Opus của Anthropic đã giữ top nhiều tháng liên tiếp, thắng nhiều head-to-head matchups hơn bất kỳ model nào khác. Một điểm đáng chú ý: Anthropic đã rút Fable 5 khỏi public access ngay sau khi ra mắt - nhưng GLM-5.2 vẫn phải đánh bại model này khi nó còn hoạt động. GLM-5.2 là model đầu tiên phá vỡ thế thống trị đó.

Ba Hành Vi Tạo Ra Sự Khác Biệt

GLM-5.2 - 3 hành vi vượt trội: Expert Templates, Zero Error Rate, Richer Output — 3 điểm mạnh cốt lõi giúp GLM-5.2 vươn lên #1 trên Design Arena

Nhóm Design Arena phân tích 1000 website được generate ngẫu nhiên và rút ra ba pattern rõ ràng:

Hành vi #1: Expert Templates chất lượng cao. GLM-5.2 có xu hướng dùng templates nhất quán dù prompt thay đổi. Khác với "copy-paste một mẫu duy nhất", các templates này không chứa antipatterns quen thuộc như purple gradients đã làm khổ các AI model thế hệ đầu. Output trung bình của GLM-5.2 cao hơn đối thủ, dù ít đa dạng hơn Fable 5 vốn tạo ra nhiều variation hơn.

Hành vi #2: Code chạy được ngay lần đầu. GLM-5.2 gọi chart.js và three.js một cách tự nhiên, không bị các lỗi phổ biến mà hầu hết model khác mắc phải. Với 21% sessions có dùng các thư viện này, win rate tăng 6.0 percentage points. Model dùng TailwindCSS trong 91% sessions - so với Opus 4.8 chỉ 57% - và Font Awesome trong 51% sessions.

Hành vi #3: Output phong phú và chi tiết hơn. GLM-5.2 tạo ra các website animated, elaborate với nhiều variation trong typography và layout - phù hợp đặc biệt cho marketing và landing page. Nhược điểm: thời gian generate trung bình 304.7 giây, gấp đôi Fable 5, và output nhiều hơn 25% characters/lines of code so với các đối thủ.

GLM-5.2 vs Fable 5 - Không Phải Tất Cả Mặt Trận

Ví dụ website được GLM-5.2 generate - thiết kế portfolio tối giản — Ví dụ website GLM-5.2 generate: portfolio design với typography mạnh, bố cục tối giản. via Design Arena

GLM-5.2 không thắng mọi hạng mục. Bức tranh đầy đủ:

Hạng mục	GLM-5.2	Fable 5
HTML Web Design	#1	(unavailable)
Game Dev	#2	#1
Data Visualization	#2	#1
3D Design	#2	#1
UI Components	#4	#1

Fable 5 vẫn là model đa năng hơn - tạo diverse outputs và nhanh hơn gấp đôi. GLM-5.2 chuyên biệt hóa: "expert template" approach cho kết quả tốt hơn ở web design, nhưng ít flexibility hơn cho các use case đòi hỏi creativity cao.

Ưu thế lớn nhất của GLM-5.2 chính là giá: $1.40/$4.40 per 1M input/output tokens, so với Fable 5's $10/$50 - rẻ hơn 7-11x với cùng mức output chất lượng trên web design.

Kỹ Thuật Phía Sau

GLM-5.2 ra mắt ngày 13/6/2026 với những nâng cấp đáng kể so với GLM-5.1:

Context window 1M token - tăng 5x từ ~200K của GLM-5.1, dùng identifier glm-5.2[1m]
744B tham số MoE (40B active per token) - cùng size với GLM-5.1
IndexShare: reuse indexer mỗi 4 transformer layers, giảm per-token FLOPs 2.9x ở 1M context
Dual effort levels: high và max - Z.ai khuyến nghị dùng max cho complex tasks
Anti-hack module: GLM-5.2 có xu hướng "reward hacking" trong coding eval (tải source code từ GitHub thay vì tự giải), Z.ai phải build module 2-stage để chặn

Trên coding benchmarks: SWE-bench Pro 62.1% (GPT-5.5: 58.6%, Gemini 3.1 Pro: 54.2%), Terminal-Bench 2.1: 81.0 (Opus 4.8: 85.0). Strongest open-source model trên cả ba long-horizon benchmarks: FrontierSWE, PostTrainBench, và SWE-Marathon.

Giá và Cách Dùng

API pay-as-you-go: $1.40 input / $4.40 output / $0.26 cached input (per 1M tokens). GLM-5.2 dùng Anthropic-compatible API endpoint tại https://api.z.ai/api/coding/paas/v4 - có thể swap vào Claude Code, Cline, OpenClaw chỉ cần đổi base URL và model name.

Subscription tiers (tháng/năm): Lite $18/$12.60 - Pro $72/$50.40 - Max $160/$112. Lưu ý quota: peak hours (14:00-18:00 UTC+8) dùng 3x quota. Off-peak 2x, nhưng có promo 1x đến hết tháng 9.

Open weights đã có trên HuggingFace và ModelScope, hỗ trợ vLLM, transformers, SGLang cho self-host. Không hỗ trợ fine-tuning qua API - cần chờ weights để tự host mới fine-tune được.

Ai Nên Thử Ngay

GLM-5.2 phù hợp nếu bạn:

Đang dùng Claude Code hoặc Cline và muốn thử model rẻ hơn mà vẫn mạnh ngang
Cần generate marketing websites, landing pages, hoặc frontend templates chất lượng cao
Muốn tự host open-weights model với MIT license - không giới hạn region, không cần thương mại
Cần 1M token context cho large codebase mà không muốn trả giá Fable 5

Không phù hợp nếu: bạn cần tốc độ cao (GLM-5.2 chậm gấp đôi), cần diverse creative outputs thay vì template-driven quality, cần vision capabilities, hoặc đang làm Game Dev / 3D Design (Fable 5 vẫn dẫn đầu ở các hạng mục này).

Kết

Việc một model MIT-licensed, 744B params, không có vision capabilities đánh bại Fable 5 trên Design Arena là tín hiệu rõ ràng: open-source frontier đang thu hẹp khoảng cách rất nhanh. GLM-5.2 không giỏi mọi thứ - nhưng ở HTML web design, chiến lược "expert templates + code-that-just-works" đã chứng minh hiệu quả hơn diverse-but-inconsistent approach. Với giá rẻ hơn 7-11x và open weights MIT, đây là model đáng thử cho bất kỳ developer nào làm frontend.

via Design Arena - via ZAI Official Blog