4 Trụ Cột Agent Bền Vững - Phần 1: 88% AI Agent Chết Trong Production - Vấn Đề Không Nằm Ở Model
88% dự án agent không bao giờ ra production theo IDC 2026. MIT đo 95% tỷ lệ thất bại. Chỉ 5% trong số 1.837 developer được khảo sát có agent thật sự chạy production. Lý do không phải model kém - mà là kỹ thuật xung quanh model. Bài này đặt tên cho vấn đề: engineering deficit.
6 Bệnh Thần Kinh của AI Agent - P2: Confabulation, Disinhibition và Anosognosia
Confabulation không phải hallucination: khi retrieval thất bại, agent bịa nguồn trông như thật thay vì thừa nhận không biết. Nghiên cứu HalluCitation 2026 tìm thấy gần 300 bài học thuật ACL/EMNLP có ít nhất 1 tài liệu tham khảo bịa đặt. Disinhibition là phanh control plane hỏng - agent đọc email phishing và thực sự gửi file đi. Anosognosia là bệnh nguy hiểm nhất: sai mà không biết mình sai.
6 Bệnh Thần Kinh của AI Agent - P1: Source Amnesia, Phantom Limb và Locked-in Syndrome
Khi AI agent mắc lỗi, bạn thường đổ lỗi cho model - nhưng vấn đề thực sự thường nằm ở runtime. Model cho agent "não", còn runtime cho nó "thân thể": mắt, tay, bộ nhớ, phanh, cơ chế tự kiểm tra. Bài này phân tích 3 trong 6 bệnh thần kinh đã được ánh xạ từ y học sang hành vi agent: Source Amnesia, Phantom Limb State và Locked-in Syndrome. Model mạnh hơn không chữa được những bệnh này.
Harness Engineering (Phần 2): 5 Chiều Thiết Kế Biến AI Agent Từ Vô Dụng Thành Production-Ready
Vercel xóa 80% tools của agent: success rate tăng từ 80% lên 100%, nhanh hơn 3.5 lần, giảm 37% token. Anthropic dùng Ralph Loop để AI làm việc qua nhiều ngày mà không mất trí nhớ. Đây là bản thiết kế chi tiết 5 chiều cốt lõi của Harness Engineering - từ Context Management đến Architectural Guardrails.
Hermes Agent v0.13.0 - The Tenacity Release: Multi-Agent Kanban, /goal và 8 bản vá bảo mật
Hermes Agent v0.13.0 ra mắt ngày 7 tháng 5 năm 2026 với 864 commits và 588 merged PRs. Multi-Agent Kanban durable giờ hỗ trợ zombie detection, heartbeat và hallucination recovery. Lệnh /goal mới giữ agent focus xuyên suốt session dài không bị lạc hướng. Bản vá 8 lỗ hổng P0, bao gồm lỗ hổng CVSS 8.1 Discord cross-guild DM bypass.
Autobrowse: Claude Code skill tự học cách duyệt web qua vòng lặp tự cải thiện
Browserbase ra mắt /autobrowse - skill cho Claude Code tự huấn luyện agent duyệt web qua outer/inner loop lấy cảm hứng từ Karpathy autoresearch. Benchmark Craigslist giảm 45% chi phí, 62% thời gian sau khi graduate skill. Cài đặt qua npx skills add browserbase/skills, miễn phí, mã nguồn mở.
Hướng dẫn cài đặt Hermes Agent và chạy nhiều agent chuyên biệt cùng lúc
Hermes Agent cài bằng một lệnh curl. Skills Hub có 687 skills sẵn. Profiles cho phép chạy nhiều agent hoàn toàn độc lập - mỗi agent có SOUL.md, memory, skills, và Telegram bot riêng. Designer, Programmer, Researcher: ba agent khác nhau hoàn toàn dù chạy cùng model.
Codex /goal Mode: 3 Mẹo Để Agent Chạy Suốt Ngày Đêm Không Lạc Đường
Codex CLI 0.128.0 ra mắt tháng 4/2026 với /goal - vòng lặp autonomous 5 bước Plan→Act→Test→Review→Iterate chạy liên tục không cần giám sát. Stress test thực tế: GPT-5.3-Codex chạy 25 giờ, sinh ~30.000 dòng code, tiêu ~13 triệu token. Bài viết này tổng hợp 3 nguyên tắc từ kinh nghiệm dùng goal mode để agent không bị lạc hoặc chạy mãi không dừng.
10 Repos Giảm Token Bill AI Agent Tới 80% - Không Ai Kiểm Tra Cái Đang Gửi Đi
Hầu hết AI agent tốn kém không phải vì model đắt, mà vì không ai kiểm soát lượng token gửi đi. 10 open-source repos này giải quyết vấn đề đó ở 7 layer khác nhau. LLMLingua nén prompt tới 20x trước khi gọi API với gần như không mất chất lượng. mem0 cô đọng 10,000 token conversation history xuống còn 200 token per agent. LiteLLM route tác vụ đơn giản sang Haiku thay vì Sonnet - tiết kiệm 20x chi phí trên cùng một output.
Nanobrowser - AI Agent Miễn Phí Sống Ngay Trong Trình Duyệt Của Bạn
Nanobrowser là Chrome extension mã nguồn mở thay thế OpenAI Operator $200/tháng, chạy hoàn toàn local trong trình duyệt. Hệ thống 3 agent chuyên biệt (Planner + Navigator + Validator) tự động hóa tác vụ web bằng tiếng Anh thông thường. Đạt 12.9k sao GitHub, hỗ trợ mọi LLM từ OpenAI, Anthropic đến Ollama chạy offline hoàn toàn miễn phí.