vibe working & agentic AI

// Posts#ai-agent

#5782026-05-11

4 Trụ Cột Agent Bền Vững - Phần 1: 88% AI Agent Chết Trong Production - Vấn Đề Không Nằm Ở Model

88% dự án agent không bao giờ ra production theo IDC 2026. MIT đo 95% tỷ lệ thất bại. Chỉ 5% trong số 1.837 developer được khảo sát có agent thật sự chạy production. Lý do không phải model kém - mà là kỹ thuật xung quanh model. Bài này đặt tên cho vấn đề: engineering deficit.

ai-agentagentic-aiengineering

5 phút đọc

#5772026-05-10

6 Bệnh Thần Kinh của AI Agent - P2: Confabulation, Disinhibition và Anosognosia

Confabulation không phải hallucination: khi retrieval thất bại, agent bịa nguồn trông như thật thay vì thừa nhận không biết. Nghiên cứu HalluCitation 2026 tìm thấy gần 300 bài học thuật ACL/EMNLP có ít nhất 1 tài liệu tham khảo bịa đặt. Disinhibition là phanh control plane hỏng - agent đọc email phishing và thực sự gửi file đi. Anosognosia là bệnh nguy hiểm nhất: sai mà không biết mình sai.

ai-agentengineeringconfabulation

7 phút đọc

#5762026-05-10

6 Bệnh Thần Kinh của AI Agent - P1: Source Amnesia, Phantom Limb và Locked-in Syndrome

Khi AI agent mắc lỗi, bạn thường đổ lỗi cho model - nhưng vấn đề thực sự thường nằm ở runtime. Model cho agent "não", còn runtime cho nó "thân thể": mắt, tay, bộ nhớ, phanh, cơ chế tự kiểm tra. Bài này phân tích 3 trong 6 bệnh thần kinh đã được ánh xạ từ y học sang hành vi agent: Source Amnesia, Phantom Limb State và Locked-in Syndrome. Model mạnh hơn không chữa được những bệnh này.

ai-agentengineeringdebugging

6 phút đọc

#5742026-05-10

Harness Engineering (Phần 2): 5 Chiều Thiết Kế Biến AI Agent Từ Vô Dụng Thành Production-Ready

Vercel xóa 80% tools của agent: success rate tăng từ 80% lên 100%, nhanh hơn 3.5 lần, giảm 37% token. Anthropic dùng Ralph Loop để AI làm việc qua nhiều ngày mà không mất trí nhớ. Đây là bản thiết kế chi tiết 5 chiều cốt lõi của Harness Engineering - từ Context Management đến Architectural Guardrails.

harness-engineeringai-agentcontext-management

8 phút đọc

#5582026-05-08

Hermes Agent v0.13.0 - The Tenacity Release: Multi-Agent Kanban, /goal và 8 bản vá bảo mật

Hermes Agent v0.13.0 ra mắt ngày 7 tháng 5 năm 2026 với 864 commits và 588 merged PRs. Multi-Agent Kanban durable giờ hỗ trợ zombie detection, heartbeat và hallucination recovery. Lệnh /goal mới giữ agent focus xuyên suốt session dài không bị lạc hướng. Bản vá 8 lỗ hổng P0, bao gồm lỗ hổng CVSS 8.1 Discord cross-guild DM bypass.

hermes-agentnous-researchai-agent

6 phút đọc

#5552026-05-08

Autobrowse: Claude Code skill tự học cách duyệt web qua vòng lặp tự cải thiện

Browserbase ra mắt /autobrowse - skill cho Claude Code tự huấn luyện agent duyệt web qua outer/inner loop lấy cảm hứng từ Karpathy autoresearch. Benchmark Craigslist giảm 45% chi phí, 62% thời gian sau khi graduate skill. Cài đặt qua npx skills add browserbase/skills, miễn phí, mã nguồn mở.

claude-codebrowserbasebrowser-automation

6 phút đọc

#5522026-05-07

Hướng dẫn cài đặt Hermes Agent và chạy nhiều agent chuyên biệt cùng lúc

Hermes Agent cài bằng một lệnh curl. Skills Hub có 687 skills sẵn. Profiles cho phép chạy nhiều agent hoàn toàn độc lập - mỗi agent có SOUL.md, memory, skills, và Telegram bot riêng. Designer, Programmer, Researcher: ba agent khác nhau hoàn toàn dù chạy cùng model.

hermes-agentai-agentmulti-agent

8 phút đọc

#5512026-05-07

Codex /goal Mode: 3 Mẹo Để Agent Chạy Suốt Ngày Đêm Không Lạc Đường

Codex CLI 0.128.0 ra mắt tháng 4/2026 với /goal - vòng lặp autonomous 5 bước Plan→Act→Test→Review→Iterate chạy liên tục không cần giám sát. Stress test thực tế: GPT-5.3-Codex chạy 25 giờ, sinh ~30.000 dòng code, tiêu ~13 triệu token. Bài viết này tổng hợp 3 nguyên tắc từ kinh nghiệm dùng goal mode để agent không bị lạc hoặc chạy mãi không dừng.

openai-codexai-agentgoal-mode

7 phút đọc

#5462026-05-07

10 Repos Giảm Token Bill AI Agent Tới 80% - Không Ai Kiểm Tra Cái Đang Gửi Đi

Hầu hết AI agent tốn kém không phải vì model đắt, mà vì không ai kiểm soát lượng token gửi đi. 10 open-source repos này giải quyết vấn đề đó ở 7 layer khác nhau. LLMLingua nén prompt tới 20x trước khi gọi API với gần như không mất chất lượng. mem0 cô đọng 10,000 token conversation history xuống còn 200 token per agent. LiteLLM route tác vụ đơn giản sang Haiku thay vì Sonnet - tiết kiệm 20x chi phí trên cùng một output.

ai-agentllmtoken-optimization

7 phút đọc

#5272026-05-07

Nanobrowser - AI Agent Miễn Phí Sống Ngay Trong Trình Duyệt Của Bạn

Nanobrowser là Chrome extension mã nguồn mở thay thế OpenAI Operator $200/tháng, chạy hoàn toàn local trong trình duyệt. Hệ thống 3 agent chuyên biệt (Planner + Navigator + Validator) tự động hóa tác vụ web bằng tiếng Anh thông thường. Đạt 12.9k sao GitHub, hỗ trợ mọi LLM từ OpenAI, Anthropic đến Ollama chạy offline hoàn toàn miễn phí.

browser-automationopen-sourceai-agent

6 phút đọc