Tất cả bài viết

// Popular Articles

#agent-harness

#9142026-04-11

Agent Harness Là Lợi Thế Cạnh Tranh Mới

deepagents-cli của LangChain nhảy từ ngoài Top 30 lên Top 5 trên Terminal-Bench 2.0 với mức tăng 13.7 điểm — mà model bên dưới không đổi. Meta-Harness của Stanford đạt 76.4% trên cùng benchmark khi dùng Claude Opus 4.6. Team Frontier của OpenAI đã ship hơn 1 triệu dòng code production với zero dòng code do người viết, chỉ với 3-7 kỹ sư. Harness mới là moat, không phải model.

agent-harnessagentic-engineeringllm-infrastructure

7 phút đọc