TL;DR

GBrain là hệ thống bộ nhớ persistent dành cho AI agent - mã nguồn mở MIT, do Garry Tan (CEO Y Combinator) phát hành ngày 9/4/2026. Đây là infrastructure thực tế Tan dùng để chạy agent OpenClaw và Hermes của mình: 17,888 trang, 4,383 hồ sơ người, 723 công ty, 21 cron jobs tự động - xây trong 12 ngày. Benchmark đạt P@5 49.1%, R@5 97.9%, cao hơn vector-only RAG hơn 31 điểm precision. Cài đặt ~30 phút, PGLite database sẵn sàng trong 2 giây.

Vấn đề nó giải quyết

AI agent hiện tại mắc bệnh "mất trí nhớ": mỗi session bắt đầu từ con số 0, không biết bạn là ai, không nhớ quyết định kiến trúc tuần trước, không lưu lại insight từ cuộc họp hôm qua. Claude Code và Cursor đều stateless theo nghĩa này.

Garry Tan mô tả vấn đề cắt gọn: "Your AI agent is smart but forgetful. GBrain gives it a brain."

Vấn đề sâu hơn ở chỗ: khi agent không có bộ nhớ, nó trả lời từ context window - nghĩa là bạn phải paste lại mọi thứ mỗi session. Với người quản lý hàng nghìn mối quan hệ, hàng trăm cuộc họp, hàng chục năm lịch sử - đây là bất khả thi. GBrain giải quyết đúng vấn đề này.

Dưới nắp ca-pô

GBrain xây trên kiến trúc 3 lớp tách biệt rõ ràng:

  • Brain Repo - Git + Markdown thuần, là nguồn sự thật duy nhất. Con người đọc và sửa được trực tiếp.

  • GBrain Retrieval - Postgres + pgvector, hybrid search kết hợp ~20 kỹ thuật xác định.

  • AI Agent Skills - 34 skills điều phối qua RESOLVER.md.

Mô hình tri thức là Compiled Truth + Timeline: mỗi trang chia đôi bởi một đường kẻ ngang. Phần trên là "compiled truth" - hiểu biết tốt nhất hiện tại, được viết lại khi có bằng chứng mới. Phần dưới là timeline append-only - vết bầu không bao giờ xóa, chỉ thêm vào. Kết quả: hệ thống phân biệt rõ "tôi tin điều gì" và "tại sao tôi tin điều đó".

Knowledge graph tự động hóa mọi liên kết. Khi agent viết trang meeting có nhắc đến Alice và Acme AI, hệ thống tự phân tích regex, suy luận loại quan hệ (attended, works_at, invested_in, founded, advises) và tạo liên kết có kiểu - zero LLM calls. Graph này mở khóa những query mà vector search không thể trả lời: "Ai đang làm ở Acme AI?", "Bob đã đầu tư vào những gì trong quý này?"

Hybrid search chạy ~20 kỹ thuật song song: vector search (HNSW cosine) + keyword search (tsvector) hòa trộn qua Reciprocal Rank Fusion, sau đó cosine re-scoring, compiled-truth boost, backlink boost, và 4-layer dedup. Multi-query expansion dùng Claude Haiku để phát sinh 3 biến thể query, bắt nhiều cách diễn đạt khác nhau.

Dream cycle là tính năng độc đáo nhất: cron jobs chạy khi bạn ngủ, tự động enrich entity pages, fix broken citations, consolidate memory, detect contradictions. Agent hoạt động như một thủ thư viên bất đồng bộ - bạn thức dậy, brain đã thông minh hơn.

Minions giải quyết vấn đề sub-agent drop work. Đây là job queue Postgres-native dành cho deterministic tasks (same input → same output). Thử nghiệm thực tế dưới tải 19-cron concurrent: Minions hoàn thành trong 753ms, $0 token, 100% thành công. Sub-agent thông thường: timeout >10,000ms, 0% spawn được. Ở scale 19,240 posts/36 tháng: Minions ~15 phút, $0; sub-agents ~9 phút best case, $1.08 token, 40% fail.

So với các giải pháp khác

Tiêu chí

GBrain

Vector RAG thuần

PKM thủ công

Precision@5

49.1%

~18% (graph-disabled)

N/A

Recall@5

97.9%

~66%

N/A

Tự maintenance

Dream cycle tự động

Không

Manual nặng

Relational queries

Có (graph traversal)

Không

Hạn chế

Knowledge compounding

Mỗi session tích lũy

Stateless

Thủ công

Setup

~30 phút

Tùy tool

Ngay lập tức

GBrain được derive từ MemPalace (predecessor). MemPalace claim 100% trên LongMemEval nhưng cộng đồng Hacker News chỉ ra đây là cấu hình full-reranking nặng - "honest top-10 no rerank" cho 88.9%. Điểm mấu chốt: hybrid search chính xác hơn nhưng chậm và đắt hơn simple vector lookup - cần cân nhắc ở scale lớn.

Ai nên dùng ngay

Phù hợp nhất:

  • Founders, executives, investors quản lý mạng lưới phức tạp - GBrain xây và bảo trì hàng nghìn hồ sơ người/công ty, prep meeting trong giây lát

  • Senior engineers dùng Claude Code/Cursor bị mất architectural context giữa sessions

  • Knowledge workers cần research tổng hợp - book-mirror skill (~$6/sách), academic-verify tự động trace claim qua publication đến raw data

Không phù hợp nếu: bạn cần SaaS one-click, không có kinh nghiệm Linux/VPS, hoặc cần kết quả ngay trong tuần này. Cold start là có thật - giá trị graph tích lũy dần theo tháng, không phát sinh ngay lập tức.

Hạn chế & chi phí

GBrain miễn phí (MIT). Chi phí vận hành thực tế:

  • Database: PGLite miễn phí (local); Supabase Pro $25/tháng (production scale)

  • LLM: Cần frontier model (Opus 4.6 / GPT-5.4) - deterministic tasks chạy $0 qua Minions, judgment tasks tốn token

  • Voice tunnel: ngrok Hobby $8/tháng (nếu dùng Voice-to-Brain)

Hạn chế kỹ thuật cần biết:

  • No principled forgetting: Brain chỉ grow, không có cơ chế quên chọn lọc - có thể ngăn đặc theo thời gian

  • Schema rot: Performance phụ thuộc schema document được bảo trì tốt - cần periodic linting

  • Abstention prompt-level: Hệ thống nói "tôi không biết" theo hướng dẫn prompt, không phải kiến trúc đảm bảo

  • Swarm-level memory: Làm sao persist memory qua 300+ concurrent sub-agents vẫn là open problem

Tiếp theo

GBrain đang ship nhanh: v0.27 vừa ra với pluggable embedding providers qua Vercel AI SDK. Roadmap công bố: full MCP support với Supabase Auth sắp ra; OAuth 2.1 production server với admin dashboard đã có ở v0.26.

Thách thức tiếp theo mà cộng đồng đang trông đợi là swarm-level memory - khi agent chạy song song 300+ sub-agents, làm sao đảm bảo consistency. Đây là open architectural problem mà GBrain chưa có lời giải.

Để cài đặt: clone repo, bun install && bun link, gbrain init. Ecosystem companion: GStack (coding skills, 70k+ stars) - GBrain là memory layer, GStack là coding layer.

Via: garrytan/gbrain, Gamgee Blog, AlphaSignal.