Tôi chạy multi-agent Hermes Agent suốt nhiều tuần - đây là những gì tôi thực sự dùng nó để làm

TL;DR

Hermes Agent của Nous Research là AI agent open-source sống trên server, ghi nhớ những gì nó học và ngày càng có năng lực hơn. Hỗ trợ 200+ model, cài miễn phí (MIT license), chạy trên phần cứng bạn có sẵn. Hầu hết bị kẹt như tôi: cài xong, nhìn vào, không biết dùng để làm gì. Bài này giải quyết đúng vấn đề đó.

Sai lầm phổ biến nhất

Lần đầu cài AI agent, tôi ngồi nhìn nó cả tiếng rồi không quay lại nữa. Vì tôi không biết dùng để làm gì. Thấy hype trên X về Mac Mini và multi-agent setup, muốn tham gia - nhưng không có vấn đề cụ thể nào cần giải quyết.

Sai lầm lớn nhất tôi thấy mọi người mắc phải là bắt đầu từ công nghệ thay vì từ vấn đề. Bạn không cần một đống GPU để bắt đầu. Bạn cần một cái danh sách.

Triết lý của tôi: AI là trợ lý, không phải thay thế tư duy. Tôi cho nó làm việc lặt vặt, tự kiểm tra rồi tiến hành. Chỉ để AI tự động hóa những thứ tôi đã hiểu cách làm. Chính cách nhìn này giúp mọi thứ click.

Thủ thuật danh sách - cách tôi tìm ra use case

Thứ thực sự có tác dụng với tôi là viết ra mọi thứ tôi làm trong một ngày, rồi đặt hai câu hỏi:

Việc gì tốn nhiều thời gian nhất?
Việc gì tôi buộc phải làm nhưng không mang lại nhiều giá trị cho workflow?

Tôi mở rộng danh sách đó cả tuần, rồi hỏi thêm: Điểm ma sát thực sự trong cuộc sống hằng ngày là gì? Không phải "dùng model nào" - mà là những thứ hay quên, những thứ làm cuộc sống khó hơn. Đó là nơi tìm ra ý tưởng agent tốt nhất.

Hãy lập danh sách đó. Rồi bắt tay vào làm.

Đội agent của tôi

Tôi không bắt đầu với một agent - tôi bắt đầu với bốn cái. Điểm hay của Hermes là bạn có thể cấu hình nhiều profile khác nhau, mỗi profile dùng một provider và model khác nhau, chuyển đổi tức thì từ TUI. Hoàn hảo cho người thích mày mò muốn so sánh cách các model phản hồi cạnh nhau.

Tech Research Agent

Tôi đưa cho agent này một chủ đề, nó trả về tóm tắt kèm trích dẫn để tôi tự đọc nguồn gốc. Tôi dùng nó để học quantize model: không để agent làm thay, mà dạy tôi cách làm. Hiện chạy trên Nous Portal với MiniMax M2.7 (gói $10/tháng, bao gồm tool calling).

Tech Task Master Agent

Agent "làm mọi thứ" - build Hermes skill, tùy chỉnh TUI config, tác vụ thực thi chung. Chạy trên GPT 5.5 qua ChatGPT Plus subscription ($20/tháng, không phải API). Giữ đến khi hết quota rồi tính tiếp.

Lifestyle Agent

Dù có bị chê: tôi có agent nhắc uống nước mỗi ngày qua Telegram. Ngớ ngẩn? Có. Thay đổi cuộc chơi? Hoàn toàn. Sắp thêm nhắc kiểm tra tư thế và giải lao. Chạy trên OpenRouter với NVIDIA Nemotron 3 Super (free model) - hoàn toàn miễn phí.

Lifestyle / Research Agent

Tôi có bệnh mãn tính (MCAS/dị ứng thực phẩm nặng) và tự nấu mọi bữa ăn. Agent này rà soát web tìm nghiên cứu về bệnh của tôi, và những ngày không có năng lượng nó gợi ý nấu gì từ nguyên liệu tôi có. Chạy trên local Qwen 3.5 9B quant với 64k context trên laptop RTX 4070 8GB ở phòng khác, Hermes kết nối qua mạng nội bộ. Tôi ấn tượng nhất với agent này - model nhỏ local mà output thực sự có ích.

Giữ chi phí thấp - bộ provider tôi dùng

Provider	Chi phí	Dùng cho
OpenRouter (free tier)	$10 một lần để có 1.000 req/ngày	Nhắc nhở lifestyle - NVIDIA Nemotron 3 Super miễn phí
Nous Portal	$10/tháng	Research agent - MiniMax M2.7 có tool calling
ChatGPT Plus	$20/tháng	Task master agent - GPT 5.5 qua subscription (không phải API)
Local (RTX 4070 8GB)	$0 ongoing	Health/lifestyle research - Qwen 3.5 9B quant
NVIDIA NIM	API key miễn phí	Thử nghiệm frontier model không tốn tiền

Số liệu xác nhận điều này: routing tác vụ thông thường sang model rẻ có thể cắt 92% chi phí API. 30 tác vụ/ngày trên DeepSeek-V3 qua OpenRouter tốn ~$1.72/tháng so với $21.60/tháng trên Claude Sonnet 4.6 cùng khối lượng. Tiết kiệm này chỉ đến khi bạn chủ đích chọn model cho từng tác vụ - đó chính xác là lý do multi-agent setup tồn tại.

DeepSeek V4 API đang giảm 75% đến hết tháng 5/2026 - đáng thử cho output chất lượng cao giá rẻ.

Hermes mạnh ở đâu - và cần cảnh giác điều gì

Hermes có một số khả năng thực sự độc đáo. Closed learning loop là tính năng nổi bật: sau khi giải quyết tác vụ phức tạp, agent tự viết một "skill" tái sử dụng được - runbook dạng markdown để dùng lại sau. Càng chạy lâu, nó càng giỏi ở workflow của bạn. Một instance 6 tháng tuổi khác hoàn toàn so với instance mới cài.

Hỗ trợ 15+ nền tảng từ một gateway cũng thực sự hữu ích. Tôi truy cập agent qua TUI và Telegram cùng lúc. Lifestyle Agent nhắn điện thoại khi tôi không ở bàn - đó là thứ làm công cụ này trở nên thực, không phải đồ chơi.

Tuy nhiên - một số lưu ý thẳng thắn từ cộng đồng:

Self-evaluation không đáng tin. Hermes hầu như luôn nghĩ nó làm tốt, kể cả khi không. Tự kiểm tra output trước khi tin vào skill tự tạo.
Self-learning có thể ghi đè chỉnh sửa thủ công. Agent có thể "cải thiện" skill bạn đã tinh chỉnh thành thứ khác. Backup những skill quan trọng.
Dự án còn trẻ. v0.12.0 tính đến ngày 30/4/2026 - phát triển nhanh, cộng đồng sôi động, nhưng ít release đã được kiểm chứng hơn các lựa chọn như OpenClaw.
Chi phí token cộng dồn rất nhanh. Mỗi tin nhắn đẩy toàn bộ lịch sử hội thoại lên API. Người dùng không quản lý session reset đã báo cáo chi phí leo thang. Reset session thường xuyên với tác vụ dài và route sang model rẻ hơn cho công việc thông thường.

Bắt đầu ngay bây giờ như thế nào

Cài đặt chỉ mất 60 giây:

curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash
hermes setup

Chạy trên Linux, macOS và WSL2 (Windows native không hỗ trợ). Setup wizard hướng dẫn cấu hình model provider, API key và nền tảng nhắn tin. Chuyển từ OpenClaw thì dùng hermes claw migrate để nhập lịch sử, skill và memory tự động.

Nhưng trước khi động vào bất cứ thứ gì - hãy lập danh sách. Viết ra những gì bạn làm hôm nay. Tìm việc lặt vặt. Tìm điểm ma sát. Rồi xây agent xung quanh những vấn đề cụ thể đó.

Đó là nơi công cụ này thực sự trở nên có ích.

Via: Hermes Agent GitHub, Official Docs, Utilo.io, Reddit.