Tất cả bài viết

kimi-k2-6moonshot-aiopen-weight-llm

#4692025-10-17

Kimi K2.6 lên Perplexity Pro & Max: open-weight SOTA giờ chỉ cách bạn 1 toggle

Moonshot vừa thả Kimi K2.6 — 1T params MoE, 256K context, swarm 300 sub-agent, đứng #1 open-weight và bám sát GPT-5.4 / Opus 4.6. Perplexity ship cho Pro và Max ngay, không cần API key.

#4532025-10-09

Kimi K2.6 + DFlash trên 8x MI300X: 508 tok/s, nhanh gấp 5.6 lần mà không mất chất lượng

HotAisle vừa công bố công thức serving production cho Kimi K2.6 (1T params) trên một node 8x AMD Instinct MI300X. Chuyển từ autoregressive sang DFlash speculative decoding đẩy throughput từ 90 tok/s lên 508 tok/s — cùng phần cứng, cùng model, output bit-identical.

kimi-k2-6dflashmi300x

dreadnodekimi-k2-6azure-cosmos-db

#4412025-10-03

Dưới 20 phút, dưới $2: Dreadnode + Kimi K2.6 tìm ra lỗ TLS high-severity trong Azure Cosmos DB

Dreadnode chạy SAST trên binary Azure Cosmos DB lấy từ Microsoft Container Registry bằng .NET reversing agent dùng Kimi K2.6. 19 phút 26 giây, $1.97, ra 1 lỗ tautological trong TLS certificate validation — managed identity token có thể bị MITM.

kimi-k2-6moonshot-ainous-research

#4362025-10-01

Kimi K2.6 đang FREE trên Nous Portal trong 24 giờ — Vercel AI Gateway mở cửa con quái vật 1T tham số

Nous Research vừa mở cửa miễn phí 24 giờ cho Kimi K2.6 — model open-weight 1T tham số của Moonshot AI, vừa đánh bại GPT-5.4 và Claude Opus 4.6 trên SWE-Bench Pro. Truy cập qua Hermes Agent, chạy trên hạ tầng Vercel AI Gateway.

hermesosnous-researchhermes-agent

#3712025-08-29

HermesOS Catalyst Update: Reliability-First Refactor, Kimi K2.6 on Venice, TUI Parity

Nous Research ships the HermesOS Catalyst update — a reliability-focused rewrite of the chat pipeline, first-class terminal/TUI support, runtime self-healing, Kimi K2.6 added to the Venice provider, and security hardening. Groundwork for the upcoming Bankr payments integration and a phased free compute tier.

kimi-k2-6moonshot-aivenice

#3562025-08-22

Kimi K2.6 lên Venice: model open-source đánh bại GPT-5.4 trên SWE-Bench Pro

Moonshot AI vừa release Kimi K2.6 — 1T-param MoE chạy phiên coding autonomous 12 giờ, điều phối 300 sub-agent. Venice vừa add model này với zero data retention, sẵn sàng cho coding agent và agentic workflow.

kimi-k2-6moonshot-aicanopy-wave

#3292025-08-08

Kimi K2.6 lên Canopy Wave: 300 agent song song, 12 giờ tự chạy, giá bằng 1/4 GPT-5.4

Moonshot AI mở rộng Kimi K2.6 sang Canopy Wave với mức giá $0.95/$4.00 per 1M token — rẻ gấp 4 lần frontier, chạy 300 agent song song qua 4.000 tool call, coding 12+ giờ không sập context.

#3052025-07-27

Kimi K2.6 tự tay refactor engine tài chính 8 năm tuổi: +185% throughput sau 13 giờ chạy một mình

Moonshot AI tung Kimi K2.6 (GA 21/04/2026) — model open-weight 1T MoE chạy autonomous 12+ giờ, điều phối 300 sub-agent. Case study nổi bật: K2.6 tự overhaul exchange-core (matching engine tài chính 8 năm tuổi, đã tối ưu sát trần), đọc flame graph, đổi thread topology 4ME+2RE → 2ME+1RE, và bật throughput trung vị lên +185% (0.43 → 1.24 MT/s), peak +133% (1.23 → 2.86 MT/s) sau 13 giờ, 1,000+ tool call, 4,000+ dòng code sửa.

kimi-k2-6moonshot-aiagentic-coding

#3042025-07-27

Kimi K2.6: 12 tiếng code tự động trong Zig, nhanh hơn LM Studio 20%

Moonshot AI chính thức phát hành Kimi K2.6 — model MoE 1T tham số với khả năng coding dài hơi 12 giờ, 4,000 tool call, và bầy 300 sub-agent. Showcase: tự viết và tối ưu inference cho Qwen3.5-0.8B bằng Zig, đẩy throughput từ ~15 lên ~193 tok/sec.

kimi-k2-6ollamaopenrouter

#2852025-07-17

Ollama kimi-k2.6:cloud crushes OpenRouter providers on throughput — field numbers inside

A hobbyist benchmark of three runs against Ollama's kimi-k2.6:cloud clocked 77–114 tok/s with sub-1.2s TTFT, leaving every OpenRouter provider (Parasail, Moonshot, NovitaAI, Cloudflare) in the dust. Caveats, context, and what the numbers actually mean.

5 phút đọc

#2462025-06-27

Kimi K2.6 tự viết inference engine bằng Zig cho Qwen3.5, đánh bại LM Studio 20%

Moonshot AI cho K2.6 chạy tự do 12 giờ trên Mac: đọc, đo, sửa, thử lại — 14 vòng, 4000+ tool call. Kết quả: engine Zig handwritten-by-LLM nhanh hơn LM Studio khoảng 20% khi inference Qwen3.5-0.8B.

kimi-k2-6moonshot-aiqwen3-5

kimi-k2-6shufflemulti-ai-designer

#2322025-06-20

Kimi 2.6 lands on Shuffle: one prompt, four frontier models, one winning design

Shuffle just added Moonshot AI's Kimi 2.6 across every tool, including the Multi-AI Designer. Write one prompt, get parallel website designs from Claude Opus 4.7, GPT-5.4, Gemini 3.1 Pro, and Kimi K2.6 — then ship the best as Next.js, Laravel, WordPress, or a design.md hand-off.

#2132025-06-11

Kimi K2.6 ra mắt: open-source SOTA SWE-Bench Multilingual 76.7%, 300 sub-agent chạy song song

Moonshot AI vừa mở mã Kimi K2.6 — mô hình coding agent 1T tham số (32B active), đạt 76.7% trên SWE-Bench Multilingual, 58.6% SWE-Bench Pro, chạy 4,000+ tool call trong 12 giờ liên tục, dàn 300 sub-agent song song, và rẻ hơn Claude Sonnet 4.6 tới 6 lần.

#2072025-06-08

Kimi K2.6 Agent: Một prompt ra cả website — video hero, WebGL shader, backend thật

Moonshot AI vừa đẩy Kimi K2.6 Code Preview ra cho subscriber: 1T params MoE, context 256K, swarm 300 agent, và quan trọng nhất — sinh được website React 19 với hero video, shader GLSL, 3D Three.js và auth + database chỉ từ một prompt.

kimi-k2-6moonshot-aiopenrouter

#2012025-06-05

Kimi K2.6 lên OpenRouter: Moonshot đẩy một model code dạng systems engineer

Ngày 20/04/2026, Moonshot phát hành Kimi K2.6 trên OpenRouter — model coding long-horizon với 262K context, kiến trúc Agent Swarm 100 sub-agent, rẻ hơn Claude Sonnet 4.6 tới 3.75 lần output. Bài này mổ xẻ con số, so sánh thẳng và xem lý do vì sao nó được gọi là 'systems engineer' thay vì chatbot.

#1962025-06-02

Kimi K2.6: Agent mã nguồn mở 1T params vượt SWE-Bench Pro và rẻ hơn Claude 6 lần

Moonshot AI ra mắt Kimi K2.6 — mô hình MoE 1T params (32B active) dẫn đầu open-source ở HLE w/ tools (54.0), SWE-Bench Pro (58.6) và BrowseComp (83.2). Agent Swarm nâng lên 300 sub-agent × 4,000 bước, chạy tự động trên 12 giờ với 4,000+ tool call. API $0.60/$2.50 per M token — rẻ hơn Claude Sonnet 4.6 khoảng 5–6 lần.