Tất cả bài viết

// Popular Articles

#ollama

#8132026-04-03

Free CLI Agent: Pi + Ollama + Gemma 4 + Parallel Search MCP — $0, No API Keys

Parallel just published a recipe for a fully free, fully local CLI agent: Mario Zechner's Pi harness, Gemma 4 on Ollama, and Parallel's no-key Search MCP. Result: a one-file `brief` CLI that prints a sourced morning-coffee summary on any topic — at $0 in API charges and zero keys in your shell history.

parallel-search-mcpgemma-4ollama

6 phút đọc

#8102026-04-02

SmallClaw: AI agent framework local-first cho small models, chạy ngon trên laptop 8GB RAM

SmallClaw là agent framework mã nguồn mở (MIT) chạy hoàn toàn local với Ollama, biến qwen3:4b thành trợ lý có thể đọc ghi file, search web, điều khiển trình duyệt — không API key, không gửi data ra cloud, không tốn $1.

smallclawlocal-llmai-agent

7 phút đọc

#7592026-03-10

Mozilla ra mắt Thunderbolt — AI client mã nguồn mở chạy trên hạ tầng của chính bạn

MZLA Technologies (công ty con của Mozilla, đứng sau Thunderbird) vừa công bố Thunderbolt: một AI client mã nguồn mở MPL-2.0 cho doanh nghiệp, tự host bằng Docker hoặc Kubernetes, tự chọn model (Anthropic, OpenAI, Mistral, Ollama, llama.cpp), và giữ toàn bộ dữ liệu trong vành đai công ty.

mozillathunderboltopen-source-ai

7 phút đọc

#7152026-02-19

hermes-local-rig-accounting: chấm dứt huyền thoại "chạy LLM local là miễn phí"

Plugin mới cho Hermes Agent tính chi phí thật trên mỗi triệu token chạy local — gồm điện, khấu hao GPU, và benchmark TPS — đặt cạnh giá cloud để bạn quyết định route bằng số liệu, không phải cảm tính.

hermes-agentlocal-llmnous-research

7 phút đọc

#6552026-01-20

Chạy Claude Code miễn phí ngay trên máy với Gemma 4 + Ollama (setup 10 phút)

Google vừa phát hành Gemma 4 với Apache 2.0, context 256K và function calling native. Kết hợp với Ollama, bạn có thể biến Claude Code thành một agent coding chạy 100% local: miễn phí, riêng tư, offline — setup dưới 10 phút.

gemma-4claude-codeollama

7 phút đọc

#6012025-12-23

DeepSeek V4-Flash đã lên Ollama Cloud: 1M context, MIT license, chạy một dòng lệnh

Ollama vừa host DeepSeek V4-Flash (284B/13B active, 1M context) trên cloud US. Một dòng lệnh để dùng với Claude Code, OpenCode hay Codex — không API key, không config.

deepseek-v4ollamaollama-cloud

6 phút đọc

#4972025-10-31

Claude Code chạy miễn phí: 3 setup GLM 5.1, Gemma 4 và Elephant Alpha

Claude Code giờ đã nói được ngôn ngữ của Ollama và OpenRouter. Ba setup dưới đây giúp bạn dùng CLI của Anthropic mà không tốn một xu token — từ GLM 5.1 qua Ollama, Gemma 4 chạy offline trên laptop, tới Elephant Alpha 100B đang free trên OpenRouter.

claude-codeollamaopenrouter

7 phút đọc

#4382025-10-02

Qwen 3.6 27B đã lên Ollama: flagship coding dense 17GB, chạy local 1 dòng lệnh

Qwen vừa release 3.6-27B (22/04/2026) — dense model 27B claim vượt Qwen3.5-397B-A17B trên mọi coding benchmark, chỉ 17GB Q4, chạy mượt RTX 4090 / M1 Max 32GB. Đã có trên Ollama library, pair 1 dòng lệnh với Claude Code / OpenCode / OpenClaw qua `ollama launch`.

qwen-3-6ollamalocal-llm

6 phút đọc

#2922025-07-21

Gemma 4 just made your GitHub Copilot subscription optional

Google's open Gemma 4 runs a full coding assistant on your laptop — offline, free, Apache 2.0. With LiveCodeBench 80% and Codeforces ELO 2150, it closes the gap to Copilot while keeping every line of code on your machine.

gemma-4github-copilotlocal-llm

7 phút đọc

#2872025-07-18

Ollama vừa biến Hermes Agent thành lệnh một dòng: `ollama launch hermes`

Gõ đúng một lệnh và bạn có Hermes Agent chạy local, kết nối Telegram, dùng Gemma 4 / Qwen hoặc GLM 5.1 — không cấu hình, không API key, tokens = 0.

ollamahermes-agentnous-research

7 phút đọc

#2852025-07-17

Ollama kimi-k2.6:cloud crushes OpenRouter providers on throughput — field numbers inside

A hobbyist benchmark of three runs against Ollama's kimi-k2.6:cloud clocked 77–114 tok/s with sub-1.2s TTFT, leaving every OpenRouter provider (Parasail, Moonshot, NovitaAI, Cloudflare) in the dust. Caveats, context, and what the numbers actually mean.

kimi-k2-6ollamaopenrouter

5 phút đọc

#2782025-07-14

Thunderbolt: Đội Thunderbird vừa mở mã nguồn AI client tự host — chọn model, giữ data

MZLA (đội Thunderbird) ngày 16/04/2026 ra mắt Thunderbolt — AI client nguồn mở MPL 2.0, chạy cloud hay Ollama tùy chọn, deploy Docker/Kubernetes, có đủ app web + iOS + Android + Mac + Linux + Windows. Mục tiêu: Firefox-vs-IE moment cho thị trường AI enterprise.

thunderboltmozillamzla

7 phút đọc

#2202025-06-14

OASIS: Quét bảo mật code bằng AI chạy local với Ollama

OASIS là công cụ audit bảo mật mã nguồn mở dùng LLM qua Ollama — scan 15 loại lỗ hổng (SQLi, XSS, RCE, SSRF...), kiến trúc hai pha + adaptive multi-level, hoàn toàn chạy local, không gửi code lên cloud.

oasisollamaai-security

7 phút đọc

#1322025-05-01

AgentArmor Studio: 8 lớp giáp cho AI Agent, chạy local bằng Ollama, đóng gói 1 file .exe

AgentArmor Studio đưa khung bảo mật 8 lớp (OWASP Top 10 Agentic AI) vào một trình visual no-code, chạy 100% local với Ollama — không API key, không phí per-token, cài xong trên Windows 10/11 trong vài phút.

agentarmorai-agent-securityowasp-top-10

7 phút đọc

#1032025-04-17

AI OSINT: Bộ công cụ recon phơi bày 175.000 server AI đang hở cửa

7WaySecurity vừa công khai ai_osint — kho dorks, Shodan/Censys query và Sigma rules để tìm LLM endpoint, vector DB và MCP server bị phơi bày trên Internet. Những con số đi kèm đủ khiến bất kỳ đội bảo mật nào phải xem lại attack surface của mình.

ai-securityosintred-team

7 phút đọc

#562025-03-24

Gemma 4 trên MLX trong Ollama: nhanh hơn rõ rệt, con số thật là bao nhiêu?

Một tweet của @thinkverse tóm gọn trend đang nóng trong cộng đồng Apple Silicon: Gemma 4 chạy qua MLX trong Ollama nhanh hơn hẳn trước. Dưới đây là con số thật, bối cảnh Ollama 0.19 + MLX backend, và tại sao Mac 32GB+ đang trở thành máy local-LLM mạnh nhất hiện tại.

gemma-4ollamamlx

7 phút đọc

#242025-03-08

Qwen 3.6 về open-source trên Ollama: một lệnh là chạy Claude Code local, zero API cost

Ollama vừa publish Qwen 3.6 open-weight với 8 variants (22–71GB), 256K context, Apache 2.0. Đáng chú ý: one-command setup Claude Code hoặc OpenClaw trỏ vào model local — `ollama launch claude --model qwen3.6` là xong. Cả Anthropic-compatible API của Ollama lẫn MIT-license OpenClaw đều plug-and-play.

qwen-3-6ollamaclaude-code

8 phút đọc