DeepSeek V4 chạy mượt trên Huawei Ascend 950: Hào CUDA của Nvidia chính thức nứt
Ai cũng đang nhìn con số 1.6T tham số và giá $1.74/1M token của DeepSeek V4. Nhưng câu chuyện thật sự nằm ở phần cứng: đây là mô hình frontier đầu tiên không lệ thuộc Nvidia top-tier. Huawei Ascend 950 supernode đạt 20ms inference cho V4-Pro — hào compute địa chính trị đang co lại rất nhanh.
Hack SEO 5 phút: Dùng Claude + Google Search Console tìm keyword bị bỏ quên
Một workflow cực rẻ, dùng data thật của chính site bạn: xuất CSV 3 tháng từ Search Console, upload vào Claude, tìm keyword Google đang show mà content chưa đụng đến — rồi thêm chúng vào bài cũ. Không cần Ahrefs, không cần đoán.
Hermes Kanban Bridge v1.3.0: Biến Obsidian vault thành command center cho AI agent
Plugin Obsidian + 13 REST endpoints, zero dependencies, ~45KB bundle. Hermes agent giờ có thể tự break-down dự án, di chuyển card, chạy standup hằng tuần — toàn bộ offline, trên máy của bạn.
Google ra mắt TPU 8t và TPU 8i: chia đôi chip AI cho training và inference
Tại Google Cloud Next 2026, Google giới thiệu thế hệ TPU thứ 8 với hai chip riêng biệt: TPU 8t cho training (121 FP4 exaflops/pod, nhanh gấp 2.8x Ironwood) và TPU 8i cho inference (1,152 chip/pod, tối ưu cho agent swarms). Đây là lần đầu Google tách hai workload này ra phần cứng chuyên biệt.
Kimi K2.6 tự tay refactor engine tài chính 8 năm tuổi: +185% throughput sau 13 giờ chạy một mình
Moonshot AI tung Kimi K2.6 (GA 21/04/2026) — model open-weight 1T MoE chạy autonomous 12+ giờ, điều phối 300 sub-agent. Case study nổi bật: K2.6 tự overhaul exchange-core (matching engine tài chính 8 năm tuổi, đã tối ưu sát trần), đọc flame graph, đổi thread topology 4ME+2RE → 2ME+1RE, và bật throughput trung vị lên +185% (0.43 → 1.24 MT/s), peak +133% (1.23 → 2.86 MT/s) sau 13 giờ, 1,000+ tool call, 4,000+ dòng code sửa.
CubeSandbox: Tencent vừa open-source nền tảng chạy hàng nghìn AI agent isolation thật trong vài mili-giây
Tencent Cloud vừa Apache-2.0 toàn bộ CubeSandbox: cold start 67ms, dưới 5MB RAM mỗi sandbox, KVM kernel isolation thật, eBPF network firewall, và là drop-in replacement cho E2B. Đây là cú đấm thẳng vào E2B/Daytona và là món quà cực lớn cho ai đang tự host code interpreter.
500+ AI tự nghiên cứu AI: 72 giờ điên rồ đầu tiên của Hugging Face ml-intern
Hugging Face vừa thả ml-intern — AI agent tự đọc paper, tự dựng dataset, tự train model. Sau 72 giờ, hơn 500 dự án nghiên cứu tự động chạy song song liên tục trên Space, sinh ra những kiến trúc kỳ quái như transformer thay thế bằng năng lượng tối thiểu và attention mô phỏng não người.
OpenAI Codex ra mắt Auto-review: một AI giám sát AI để code chạy 7 tiếng không cần bạn ngồi canh
Codex v0.124.0 đưa Auto-review lên trạng thái stable — agent reviewer thứ hai tự đánh giá rủi ro và duyệt các bước nhạy cảm (chạy test, build, shell, network) thay con người, mở đường cho các task dài hàng giờ và nhiều agent chạy song song.
Khi UI biết bắt sáng: pipeline 3 bước gpt-image-2 + normal map của @pwnies
Một design engineer vừa gộp gpt-image-2, AI normal map và shader lighting lại làm một — biến UI web phẳng thành giao diện có khối, có bóng, có ánh sáng động theo con trỏ chuột.
Claude Managed Agents có Memory: agent giờ học được qua nhiều session
Anthropic vừa đưa built-in memory cho Claude Managed Agents lên public beta (23/04/2026). Agent không còn khởi động với context rỗng mỗi lần — memory stores mount như thư mục /mnt/memory/ giúp agent nhớ user preferences, project conventions và domain knowledge qua nhiều session. Tối đa 8 stores/session, 100KB/memory, versioning immutable 30 ngày, có redact cho compliance.