Tất cả bài viết

// Popular Articles

#gguf

#6922026-02-08

Chạy Qwen ở Q3: Bên kia vách đá precision của local LLM

Q3 quant có thể trả lời giống Claude Opus, nhưng cái giá là một cú thinking loop 60 giây và +60% wall-clock. Đây là bản chất của việc đi xuống dưới Q4 — và tại sao đôi khi vẫn đáng.

qwenllm-quantizationlocal-llm

7 phút đọc

#2962025-07-23

Unsloth sweeps 22/22: Gemma 4 26B-A4B GGUFs are now SOTA

An independent benchmark ranked 80 GGUF quantizations of Google's new Gemma 4 26B-A4B across 6 uploaders. Unsloth's Dynamic 2.0 GGUFs placed #1 in every single one of the 22 tested quant sizes on mean KL divergence — the cleanest sweep we've seen in open-model quantization.

gemma-4unslothgguf

6 phút đọc

#2662025-07-08

SGLang CVE-2026-5760: một file GGUF độc biến /v1/rerank thành shell (CVSS 9.8)

Lỗ hổng RCE trong SGLang 0.5.9: một Jinja2 chat template độc bên trong file GGUF chạy code Python trên server ngay khi /v1/rerank được gọi. CVSS 9.8, chưa có patch chính thức, PoC đã public.

sglangcve-2026-5760llm-security

8 phút đọc

#372025-03-15

2-bit Qwen3.6-35B-A3B làm bug hunt cả repo — chạy local trong Unsloth Studio với ~13GB RAM

Unsloth vừa khoe bản 2-bit Qwen3.6-35B-A3B GGUF hoàn tất một buổi bug hunt đầy đủ: thu evidence, repro lỗi, fix, viết test và draft PR writeup — với 30+ tool call, 20 website và thực thi Python, tất cả chạy local trong Unsloth Studio. Đây là cú đấm mạnh vào narrative "muốn agent coding tốt thì phải gọi API cloud".

qwen3-6unslothlocal-llm

7 phút đọc