Warp Oz: Điều Phối Claude Code, Codex và Warp Agent Song Song Trên Cloud
Warp nâng cấp Oz thành control plane đa harness đầu tiên, chạy Claude Code, Codex và Warp Agent song song trên cloud. Lệnh /orchestrate phân chia task phức tạp cho nhiều subagent, mỗi agent trong Docker container riêng. Agent Memory - bộ nhớ xuyên harness - đang research preview, giúp agent học phong cách code của team. Nội bộ Warp, Oz viết 60% số PR và chặn gần $60,000 gian lận trong một buổi sáng.
Hermes Agent: 4 cấp độ setup từ prototype đến đội AI tự động
Hermes Agent v0.6.0 giới thiệu kiến trúc multi-agent 4 cấp - từ 1 agent prototype đến đội AI chạy hoàn toàn tự động qua cron. Trên benchmark network design, setup đa agent đạt 75-85% success rate so với chain-of-thought baseline. Hermes 4.3 36B đạt 93.8% trên MATH-500 - cạnh tranh với các model lớn hơn. Software miễn phí MIT, chỉ trả chi phí API ($0.13/M input tokens với Hermes 4 70B).
1 Research Agent, 5 Agent Thông Minh Hơn: Kiến Trúc Vault Bằng Chứng Cho Hệ Thống AI
Trong 3 tháng, một research agent duy nhất ghi lại hơn 8.000 mảnh bằng chứng có cấu trúc trên 16 chủ đề, giúp toàn bộ 5 agent còn lại trong hệ thống bắt đầu mỗi ngày với nền tảng kiến thức tốt hơn. Điểm mấu chốt là scraping thô không phải research thật - nếu dữ liệu không có cấu trúc, các agent khác không dùng được. Research vault phân tách rõ ràng: raw input, finding, claim, verified knowledge và task là 4 thứ hoàn toàn khác nhau.
Multi-Agent Orchestration: Khi một AI không còn đủ
Anthropic's multi-agent research system vượt single Opus 4 tới 90.2% hiệu suất trên internal evaluation - token usage giải thích 80% variance. Kiến trúc hub-and-spoke chia task cho specialist agents chuyên biệt, mỗi agent chỉ làm một việc cực tốt. Quy tắc bị vi phạm nhiều nhất: context KHÔNG tự động truyền giữa agents - phải pass tường minh hoàn toàn. Ba failure mode phổ biến nhất là narrow decomposition, lost context, và telephone effect.