// Popular Articles

#token-optimization
#5382025-11-21

Exa Highlights: cắt 96% input token cho web agent, 500 token đủ thay 10K token nguyên trang

Exa AI Labs vừa tung model trích xuất text "Highlights" — dynamic chọn đúng các token liên quan nhất với query, giảm 96% input token. 500 token highlights đạt chất lượng RAG tương đương 10K token nguyên trang. Đặc biệt hữu ích cho GPT-5.5 và các agent long-horizon nơi context bloat là nút cổ chai.

exaweb-agentsrag
6 phút đọc
#1472025-05-09

sqz: CLI Rust nén output trước khi vào LLM, file đọc lại chỉ tốn 13 tokens

sqz là CLI Rust hook vào Claude Code, Cursor, Cline và 10+ tool khác, tự nén output command trước khi vào context. File đọc lặp lần 2 trở đi chỉ tốn 13 tokens reference; đọc 5 lần giảm 10,000 xuống 826 tokens.

sqzrust-clillm-tooling
6 phút đọc