- claude-mem đạt 73.9k GitHub stars sau 7 tháng - plugin giúp Claude Code nhớ mọi thứ qua các session.
- Video demo cho thấy Claude tự chạy 5 task liên tiếp (98.8k tokens, 5h 42m) để nâng cấp toàn bộ CMS y tế mà không cần hỏi lại người dùng.
- Smart compression giảm context 95%, từ 10,000 tokens xuống còn ~500 tokens.
- Cài bằng một lệnh: npx claude-mem install.
TL;DR
Một video ngắn đăng ngày 16/4/2026 trên X đang lan rộng trong cộng đồng developer: màn hình bên trái là Claude Code đang tự chạy 5 task liên tiếp để nâng cấp toàn bộ CMS của một trang y tế, bên phải là claude-mem viewer hiển thị lịch sử session theo thời gian thực. Không có người gõ lệnh. Không có câu hỏi xác nhận. Chỉ có AI làm việc.
Plugin phía sau cảnh đó - claude-mem - vừa chạm mốc 73.9k GitHub stars sau 7 tháng ra mắt.
Chuyện gì xảy ra trong video?
User @noisyb0y1 (Noisy) quay lại màn hình đôi khi Claude Code đang tự xử lý dự án ccn-dermatology - một website phòng khám da liễu. Chuỗi task mà Claude tự thực hiện:
- Upgrade Netlify CMS lên Decap CMS - 9 tool uses, 28.1k tokens, hoàn thành trong 48.6 giây
- Restructure hệ thống text content - 45 tool uses, 98.8k tokens, mất 5 giờ 42 phút 44 giây
- Enhance image management - 46 tool uses, 68.7k tokens, hoàn thành trong 33 phút 44 giây
- Add CMS preview functionality - 38 tool uses, 54.3k tokens, hoàn thành trong 6 phút 39 giây
- Simplify CMS config cho user - đang chạy khi video kết thúc
Tổng cộng hơn 250k tokens tiêu thụ, hàng trăm tool calls, và Claude xử lý tuần tự từng bước mà không cần người dùng can thiệp giữa chừng. Đây chính xác là hành vi mà Anthropic gọi là agentic workflow.
claude-mem là gì?
claude-mem là plugin Claude Code do thedotmack phát triển, giải quyết một vấn đề cốt lõi: Claude Code không nhớ gì giữa các session. Mỗi lần mở terminal mới là một tờ giấy trắng.
Plugin hoạt động theo cơ chế observer: một worker service chạy ngầm tại localhost:37777, lắng nghe mọi thứ Claude làm qua 5 lifecycle hooks (SessionStart, UserPromptSubmit, PostToolUse, Stop, SessionEnd), rồi nén và lưu vào SQLite + Chroma vector database.
Kết quả: session sau tự động nhận context từ session trước thông qua hybrid search (semantic + keyword). Web viewer tại localhost:37777 là giao diện React hiển thị toàn bộ observation stream theo thời gian thực - chính cái panel bên phải trong video viral kia.
Con số đáng chú ý
- 73.9k GitHub stars, 6.3k forks trong 7 tháng (v12.7.5 tính đến 5/2026)
- 95% giảm token context: 1,000-10,000 tokens → ~500 tokens nhờ smart compression
- ~2.1k tokens tổng chi phí context khởi đầu session (progressive disclosure 3 lớp)
- 6-12x ít token hơn khi dùng Smart Explore (AST-powered navigation, v10.5.0)
- ~1,000 tool uses per session với Endless Mode beta (tăng 20x bình thường, nhưng thêm 60-90 giây per call)
- 1,844 commits, 109 contributors, 259 releases
Multi-agent đang ở đâu trong 2026?
Video trên là ví dụ điển hình của orchestrator-subagent pattern: một Claude instance cha phân rã công việc lớn thành các Task nhỏ, mỗi Task chạy trong context riêng rồi báo cáo kết quả về.
Anthropic đã tích hợp sẵn Agent Teams (experimental, v2.1.32+) - tính năng cho phép các teammate message trực tiếp với nhau thay vì chỉ qua lead. Để bật:
// settings.json
"CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS": "1"
Ngoài ra có các công cụ cộng đồng như Gas Town (Steve Yegge - kiến trúc "mayor" kiểu Kubernetes cho AI agents) và Multiclaude (tự merge nếu CI pass, kiểu Brownian ratchet). Multi-agent hiện phù hợp với ~5% các task development, nhưng khi phù hợp thì tiết kiệm hàng giờ làm việc thủ công.
Ai nên thử ngay?
claude-mem phù hợp nhất với:
- Developer làm việc trên dự án dài ngày với nhiều session Claude Code
- Các tác vụ refactor lớn hoặc migration (như video trên - nâng cấp CMS cho cả hệ thống)
- Team muốn có "audit trail" về quyết định kỹ thuật Claude đã đưa ra
- Bất kỳ ai đang mệt mỏi với việc phải giải thích lại context cho Claude mỗi buổi sáng
Cài đặt chỉ một lệnh:
npx claude-mem install
Hoặc qua Claude Code plugin marketplace: /plugin marketplace add thedotmack/claude-mem && /plugin install claude-mem
Giới hạn cần biết trước khi dùng
Endless Mode beta hiện thêm 60-90 giây per tool invocation - không phù hợp cho rapid iterative dev. License có sự không nhất quán giữa các nguồn (AGPL-3.0 vs Apache 2.0 - cần kiểm tra lại trên GitHub). Chroma vector DB cần setup riêng nếu muốn dùng semantic search nâng cao.
Roadmap gần nhất: RAD (Real-Time Agent Data) - open standard cho AI agent memory, bổ sung cho RAG bằng cách capture working intelligence thay vì chỉ knowledge tĩnh.
Kết
Video 20 giây của @noisyb0y1 nói lên điều mà hàng trang blog không nói được: Claude Code đã đủ mạnh để tự xây một CMS hoàn chỉnh. claude-mem là lớp bổ sung giúp nó nhớ những gì đã làm - biến từng session đơn lẻ thành một chuỗi kinh nghiệm tích lũy.
73.9k stars không phải ngẫu nhiên.
Nguồn: github.com/thedotmack/claude-mem · claude-mem.ai · Shipyard: Multi-agent orchestration 2026




