// Posts#ai-agent
CLI-Anything: Biến Mọi Phần Mềm Thành Agent-Native Chỉ Với Một Lệnh
#5122026-05-06

CLI-Anything: Biến Mọi Phần Mềm Thành Agent-Native Chỉ Với Một Lệnh

CLI-Anything là framework Python của HKUDS tự động sinh CLI agent-native cho mọi phần mềm - từ GIMP, Blender đến LibreOffice. 2.280 tests với 100% pass rate trên 34+ ứng dụng. Đạt 37.600 GitHub stars chỉ trong vài tuần ra mắt. Apache 2.0, miễn phí hoàn toàn.

cli-anythingai-agentopen-source
6 phút đọc
Từ $2,630/tháng về $0: 7 repo open-source thay thế toàn bộ trading subscriptions
#5072026-05-06

Từ $2,630/tháng về $0: 7 repo open-source thay thế toàn bộ trading subscriptions

Một developer đã hủy toàn bộ subscription trading - từ Bloomberg Terminal $2,000/tháng đến TradingView Pro - và thay bằng 7 repo GitHub hoàn toàn miễn phí. rtk đạt 45K stars nhờ giảm 60-90% chi phí token trên Claude Code và 10 AI tools khác. goose, AI agent của Block/Jack Dorsey, đạt 44.8K stars và hỗ trợ 15+ LLM providers. Toàn bộ stack Apache 2.0 hoặc MIT, $0 chi phí tháng.

open-sourcetradingdeveloper-tools
7 phút đọc
Tencent open-source CubeSandbox: boot AI agent trong 60ms, thay thế E2B miễn phí
#5022026-05-06

Tencent open-source CubeSandbox: boot AI agent trong 60ms, thay thế E2B miễn phí

Tencent open-source CubeSandbox ngày 21/4/2026 - sandbox AI agent boot dưới 60ms, nhanh 2.5 lần so với E2B (150ms). Mỗi instance chỉ tốn dưới 5MB RAM, cho phép chạy 2,000+ sandbox đồng thời trên một server 96-core. E2B drop-in compatible: chỉ đổi 3 biến môi trường, không cần sửa code. Apache 2.0, hoàn toàn miễn phí, tự host.

cubesandboxtencent-cloudai-agent
6 phút đọc
Firecrawl Agent: Bỏ Qua Pipeline RAG, Chỉ Cần URL + Câu Hỏi
#4862026-05-06

Firecrawl Agent: Bỏ Qua Pipeline RAG, Chỉ Cần URL + Câu Hỏi

Firecrawl Agent endpoint cho phép truyền URL + câu hỏi tự nhiên và nhận về grounded answer ngay lập tức - không cần scrape, chunk, embed hay vector DB. Agent chạy với 2 model: spark-1-mini (giảm 60% chi phí) và spark-1-pro cho nghiên cứu phức tạp. Pricing: Free 1,000 credits/tháng; Standard $83/tháng với 100,000 credits và 500 req/min. Đang ở Preview stage với 5 lượt chạy miễn phí mỗi ngày.

firecrawlai-agentweb-scraping
5 phút đọc
AI Agent tự cải thiện bằng Rubric: Vòng phản hồi thay đổi cuộc chơi
#4792026-05-06

AI Agent tự cải thiện bằng Rubric: Vòng phản hồi thay đổi cuộc chơi

AI agent giờ có thể tự cải thiện liên tục bằng cách dùng một rubric mô tả tiêu chí hoàn thành nhiệm vụ, kết hợp grader sub-agent chuyên đánh giá từng vòng lặp. HyperAgents đạt imp@50 = 0.630 trên Olympiad math grading - trong khi hệ thống do con người thiết kế tay đạt 0.0. SICA tự chỉnh sửa code của chính mình, nâng điểm SWE-bench từ 17% lên 53%. Đây là pattern kỹ thuật đang được áp dụng trong sản xuất tại Meta, Cognition và Google DeepMind.

ai-agentself-improvementrubric
7 phút đọc
10 Khái Niệm Cơ Bản Trước Khi Làm AI Agent - P2: ReAct, Multi-Agent và An Toàn
#4702026-05-05

10 Khái Niệm Cơ Bản Trước Khi Làm AI Agent - P2: ReAct, Multi-Agent và An Toàn

5 khái niệm nâng cao quyết định Agent của bạn có đáng tin cậy hay không: ReAct pattern, Multi-Agent collaboration, Error handling, Safety control và cách chọn framework đúng. Nhóm Multi-Agent thực tế chỉ 3-4 agent do coordination overhead tăng nhanh.

ai-agentreact-patternmulti-agent
7 phút đọc
10 Khái Niệm Cơ Bản Trước Khi Làm AI Agent - P1: Nền Tảng Kiến Trúc
#4692026-05-05

10 Khái Niệm Cơ Bản Trước Khi Làm AI Agent - P1: Nền Tảng Kiến Trúc

AI Agent không phải chatbot thông minh hơn - đó là một hệ thống thực thi hoàn chỉnh gồm LLM, tool calling, task planning, memory và context management. Bài này giải thích 5 khái niệm nền tảng bạn phải nắm trước khi bắt tay code Agent. MCP tháng 3/2026 đã vượt 97 triệu monthly SDK downloads.

ai-agentllmmcp
7 phút đọc
Harness Engineering (Phần 1): Tại sao Claude Opus 4.7 và GPT-5.4 đạt 0% khi làm việc thật?
#4672026-05-05

Harness Engineering (Phần 1): Tại sao Claude Opus 4.7 và GPT-5.4 đạt 0% khi làm việc thật?

ProgramBench - benchmark mới từ nhóm SWE-Bench - vừa công bố kết quả gây sốc: Claude Opus 4.7, GPT-5.4, Gemini 3.1 Pro đều đạt 0% khi được yêu cầu rebuild phần mềm thực tế từ đầu. Lỗi không nằm ở model - mà nằm ở Harness. Harness Engineering là kỹ thuật xây dựng "bộ kiểm soát" bao quanh LLM, được tóm gọn bằng công thức: Agent = Model + Harness. Bài này giải thích tại sao công thức đó quyết định tất cả.

harness-engineeringai-agentllm
7 phút đọc
deepsec: Công cụ mã nguồn mở của Vercel tìm lỗ hổng bảo mật bằng nghìn AI agent song song
#4592026-05-04

deepsec: Công cụ mã nguồn mở của Vercel tìm lỗ hổng bảo mật bằng nghìn AI agent song song

deepsec là security harness mã nguồn mở từ Vercel Labs, dùng Claude Opus 4.7 và GPT 5.5 để rà soát codebase tìm lỗ hổng bảo mật. Công cụ scale lên 1.000+ Vercel Sandbox song song, cắt thời gian audit từ nhiều tháng xuống vài phút. Chi phí ~$25-60 cho 100 file, Apache 2.0 license, chạy hoàn toàn trên hạ tầng của bạn.

deepsecsecurityvercel
6 phút đọc
10 AI Agent Miễn Phí Hoạt Động 24/7 - P2: Open WebUI, MetaGPT, CrewAI, AutoGen, Mem0
#4532026-05-03

10 AI Agent Miễn Phí Hoạt Động 24/7 - P2: Open WebUI, MetaGPT, CrewAI, AutoGen, Mem0

5 AI agent chuyên biệt còn lại trong danh sách: Open WebUI tự host ChatGPT cá nhân, MetaGPT cho software development, CrewAI với 5.2 triệu lượt tải/tháng, AutoGen của Microsoft đang vào maintenance mode, và Mem0 - bộ nhớ dài hạn cho mọi AI agent.

ai-agentopen-sourcecrewai
7 phút đọc