Tất cả bài viết

// Popular Articles

#ai-engineering

#7612026-03-10

Blockify và IdeaBlocks: Giảm corpus RAG 40x, tăng độ chính xác y tế 261%

Blockify giảm kích thước corpus xuống còn 2.5% kích thước gốc trong khi giữ lại 99% factual integrity. Token tiêu thụ mỗi query giảm 3.09x - từ 1,515 xuống 490 tokens. Độ chính xác vector search tăng 2.29x so với chunking truyền thống. Trong thử nghiệm lâm sàng với Llama 3.2 3B chạy on-device, Blockify cải thiện độ chính xác trung bình 261% và lên đến 650% với trường hợp DKA management.

ragblockifyideablock

6 phút đọc

#1392025-05-05

Sentry skill-writer: Meta-Skill mã nguồn mở biến việc viết Agent Skill thành quy trình kỹ thuật

Sentry vừa mở mã một meta-skill tên là skill-writer — không làm việc trực tiếp cho user, mà định nghĩa một quy trình 7 bước, 5 loại skill và hệ thống depth gate để biến việc viết Agent Skill thành một thao tác kỹ thuật có thể tái lập và kiểm toán được.

agent-skillssentryai-engineering

7 phút đọc

#82026-05-02

Claude Sub-agents vs. Agent Teams - Hai paradigm, một quyết định kiến trúc

Sub-agents chạy cô lập, fire-and-forget, phù hợp pipeline 2-4 bước tuần tự. Agent Teams dùng shared task list peer-to-peer, rẻ hơn 3-5 lần ở quy mô 10+ agents song song. Chọn sai kiến trúc là sai ngay từ đầu - không phải optimize sau.

claude-agent-sdkmulti-agentsub-agents

7 phút đọc

#22026-05-02

Agent Memory Engineering: Tại sao memory không thể copy giữa Claude Code, Codex và Hermes

Memory là điểm hợp nhất giữa model và harness - không phải chỉ là dữ liệu. Claude Code, Codex (OpenAI) và Hermes (Nous Research) dùng ba kiến trúc hoàn toàn khác nhau, khiến memory không thể chuyển giữa các agent chỉ bằng cách copy file. Vector database đã thua - người thắng là “ LLM + markdown + filesystem tools “

agent-memoryclaude-codecodex

7 phút đọc