CLI-Anything: Biến Mọi Phần Mềm Thành Agent-Native Chỉ Với Một Lệnh
CLI-Anything là framework Python của HKUDS tự động sinh CLI agent-native cho mọi phần mềm - từ GIMP, Blender đến LibreOffice. 2.280 tests với 100% pass rate trên 34+ ứng dụng. Đạt 37.600 GitHub stars chỉ trong vài tuần ra mắt. Apache 2.0, miễn phí hoàn toàn.
Từ $2,630/tháng về $0: 7 repo open-source thay thế toàn bộ trading subscriptions
Một developer đã hủy toàn bộ subscription trading - từ Bloomberg Terminal $2,000/tháng đến TradingView Pro - và thay bằng 7 repo GitHub hoàn toàn miễn phí. rtk đạt 45K stars nhờ giảm 60-90% chi phí token trên Claude Code và 10 AI tools khác. goose, AI agent của Block/Jack Dorsey, đạt 44.8K stars và hỗ trợ 15+ LLM providers. Toàn bộ stack Apache 2.0 hoặc MIT, $0 chi phí tháng.
Tencent open-source CubeSandbox: boot AI agent trong 60ms, thay thế E2B miễn phí
Tencent open-source CubeSandbox ngày 21/4/2026 - sandbox AI agent boot dưới 60ms, nhanh 2.5 lần so với E2B (150ms). Mỗi instance chỉ tốn dưới 5MB RAM, cho phép chạy 2,000+ sandbox đồng thời trên một server 96-core. E2B drop-in compatible: chỉ đổi 3 biến môi trường, không cần sửa code. Apache 2.0, hoàn toàn miễn phí, tự host.
Firecrawl Agent: Bỏ Qua Pipeline RAG, Chỉ Cần URL + Câu Hỏi
Firecrawl Agent endpoint cho phép truyền URL + câu hỏi tự nhiên và nhận về grounded answer ngay lập tức - không cần scrape, chunk, embed hay vector DB. Agent chạy với 2 model: spark-1-mini (giảm 60% chi phí) và spark-1-pro cho nghiên cứu phức tạp. Pricing: Free 1,000 credits/tháng; Standard $83/tháng với 100,000 credits và 500 req/min. Đang ở Preview stage với 5 lượt chạy miễn phí mỗi ngày.
AI Agent tự cải thiện bằng Rubric: Vòng phản hồi thay đổi cuộc chơi
AI agent giờ có thể tự cải thiện liên tục bằng cách dùng một rubric mô tả tiêu chí hoàn thành nhiệm vụ, kết hợp grader sub-agent chuyên đánh giá từng vòng lặp. HyperAgents đạt imp@50 = 0.630 trên Olympiad math grading - trong khi hệ thống do con người thiết kế tay đạt 0.0. SICA tự chỉnh sửa code của chính mình, nâng điểm SWE-bench từ 17% lên 53%. Đây là pattern kỹ thuật đang được áp dụng trong sản xuất tại Meta, Cognition và Google DeepMind.
10 Khái Niệm Cơ Bản Trước Khi Làm AI Agent - P2: ReAct, Multi-Agent và An Toàn
5 khái niệm nâng cao quyết định Agent của bạn có đáng tin cậy hay không: ReAct pattern, Multi-Agent collaboration, Error handling, Safety control và cách chọn framework đúng. Nhóm Multi-Agent thực tế chỉ 3-4 agent do coordination overhead tăng nhanh.
10 Khái Niệm Cơ Bản Trước Khi Làm AI Agent - P1: Nền Tảng Kiến Trúc
AI Agent không phải chatbot thông minh hơn - đó là một hệ thống thực thi hoàn chỉnh gồm LLM, tool calling, task planning, memory và context management. Bài này giải thích 5 khái niệm nền tảng bạn phải nắm trước khi bắt tay code Agent. MCP tháng 3/2026 đã vượt 97 triệu monthly SDK downloads.
Harness Engineering (Phần 1): Tại sao Claude Opus 4.7 và GPT-5.4 đạt 0% khi làm việc thật?
ProgramBench - benchmark mới từ nhóm SWE-Bench - vừa công bố kết quả gây sốc: Claude Opus 4.7, GPT-5.4, Gemini 3.1 Pro đều đạt 0% khi được yêu cầu rebuild phần mềm thực tế từ đầu. Lỗi không nằm ở model - mà nằm ở Harness. Harness Engineering là kỹ thuật xây dựng "bộ kiểm soát" bao quanh LLM, được tóm gọn bằng công thức: Agent = Model + Harness. Bài này giải thích tại sao công thức đó quyết định tất cả.
deepsec: Công cụ mã nguồn mở của Vercel tìm lỗ hổng bảo mật bằng nghìn AI agent song song
deepsec là security harness mã nguồn mở từ Vercel Labs, dùng Claude Opus 4.7 và GPT 5.5 để rà soát codebase tìm lỗ hổng bảo mật. Công cụ scale lên 1.000+ Vercel Sandbox song song, cắt thời gian audit từ nhiều tháng xuống vài phút. Chi phí ~$25-60 cho 100 file, Apache 2.0 license, chạy hoàn toàn trên hạ tầng của bạn.
10 AI Agent Miễn Phí Hoạt Động 24/7 - P2: Open WebUI, MetaGPT, CrewAI, AutoGen, Mem0
5 AI agent chuyên biệt còn lại trong danh sách: Open WebUI tự host ChatGPT cá nhân, MetaGPT cho software development, CrewAI với 5.2 triệu lượt tải/tháng, AutoGen của Microsoft đang vào maintenance mode, và Mem0 - bộ nhớ dài hạn cho mọi AI agent.