GraphGen: Sinh Dữ Liệu Huấn Luyện LLM từ Knowledge Graph
GraphGen là framework open-source tạo synthetic training data cho LLM từ knowledge graph, dùng ECE metric để nhắm vào knowledge gap cụ thể. Benchmark với Qwen2.5-7B: +15.5 điểm AIME25 (toán), +14.4 điểm SeedBench (nông nghiệp), +6.7 điểm GPQA-Diamond so với baseline tốt nhất. Sinh ~50,000 samples trong 2 giờ trên 8 A100, output đa dạng hơn 59% (MTLD 75.8 vs 47.6). Apache 2.0, cài bằng uv pip install graphg.
Cognee: open-source memory layer đưa AI agents thoát khỏi 'mất trí' sau mỗi session
Cognee thay RAG bằng pipeline ECL (Extract, Cognify, Load) + Memify, biến dữ liệu thành knowledge graph lai vector — chạy trong 6 dòng code, đạt ~90% accuracy so với ~60% của RAG, vừa gọi $7.5M seed.
3 GitHub Agent Projects Cho AI Coding - P2: agentmemory, graphiti và Bộ Ba Hoàn Chỉnh
agentmemory tự động ghi nhớ xuyên session với 95.2% độ chính xác truy xuất, chỉ tốn ~1,900 tokens/session thay vì 22,000+ với built-in memory. graphiti xây knowledge graph có thời gian - track fact thay đổi theo thời gian với sub-second latency, 26.5k stars và MCP Server 1.0 đã có hàng trăm nghìn weekly users.
3 GitHub Agent Projects Cho AI Coding - P1: graphify, Bản Đồ Dự Án
graphify biến toàn bộ codebase thành knowledge graph có thể query, giảm 71.5 lần token so với đọc thô. Đạt 53.3k GitHub stars, hỗ trợ 31 ngôn ngữ lập trình, chạy trên Hermes, Claude Code, Cursor và 10+ agent tool. Cài một lệnh, chạy /graphify . là agent có ngay bản đồ dự án đầy đủ.