// Popular Articles
Exa Highlights: cắt 96% input token cho web agent, 500 token đủ thay 10K token nguyên trang
Exa AI Labs vừa tung model trích xuất text "Highlights" — dynamic chọn đúng các token liên quan nhất với query, giảm 96% input token. 500 token highlights đạt chất lượng RAG tương đương 10K token nguyên trang. Đặc biệt hữu ích cho GPT-5.5 và các agent long-horizon nơi context bloat là nút cổ chai.
sqz: CLI Rust nén output trước khi vào LLM, file đọc lại chỉ tốn 13 tokens
sqz là CLI Rust hook vào Claude Code, Cursor, Cline và 10+ tool khác, tự nén output command trước khi vào context. File đọc lặp lần 2 trở đi chỉ tốn 13 tokens reference; đọc 5 lần giảm 10,000 xuống 826 tokens.