// Popular Articles

Google đập vỡ "bức tường latency": TPU 8t và 8i — hai con chip cho kỷ nguyên AI agent
#4732025-10-19

Google đập vỡ "bức tường latency": TPU 8t và 8i — hai con chip cho kỷ nguyên AI agent

Tại Cloud Next 2026, Google tách thế hệ TPU thứ 8 thành hai con chip riêng: 8t cho training, 8i cho inference. Pod 9.600 chip, 121 FP4 exaflops, SRAM on-chip gấp 3 lần — và Anthropic vừa cam kết 3,5 GW compute cho Google.

google-tputpu-8ttpu-8i
7 phút đọc
#4632025-10-14

Workspace Intelligence: Google vừa gắn một "bộ não ngữ nghĩa" cho toàn bộ Gmail, Docs, Sheets, Chat

Tại Cloud Next '26, Google ra mắt Workspace Intelligence — lớp ngữ nghĩa động chạy ngầm khắp Workspace, tự kéo context từ email, file, meeting note để Gemini không còn cần bạn mồi prompt. GA mặc định trên hầu hết Workspace plan, kèm Ask Gemini in Chat, AI Inbox, Drive Projects và cú đòn migration nhắm thẳng Microsoft 365.

google-workspaceworkspace-intelligencegemini
7 phút đọc
Crucix: chạy trung tâm OSINT trị giá 6 con số trên laptop của bạn — miễn phí, tự host
#4572025-10-11

Crucix: chạy trung tâm OSINT trị giá 6 con số trên laptop của bạn — miễn phí, tự host

Governments chi hàng triệu USD build hệ thống gom open-source data. Crucix cho bạn cùng power đó trên localhost — 27 nguồn, quét 15 phút/lần, alert qua Telegram/Discord, zero cloud.

crucixosintopen-source
7 phút đọc
Kimi K2.6 + DFlash trên 8x MI300X: 508 tok/s, nhanh gấp 5.6 lần mà không mất chất lượng
#4532025-10-09

Kimi K2.6 + DFlash trên 8x MI300X: 508 tok/s, nhanh gấp 5.6 lần mà không mất chất lượng

HotAisle vừa công bố công thức serving production cho Kimi K2.6 (1T params) trên một node 8x AMD Instinct MI300X. Chuyển từ autoregressive sang DFlash speculative decoding đẩy throughput từ 90 tok/s lên 508 tok/s — cùng phần cứng, cùng model, output bit-identical.

kimi-k2-6dflashmi300x
7 phút đọc
Claude Code /ultrareview: Senior reviewer trên cloud, tìm bug trước khi merge
#4522025-10-09

Claude Code /ultrareview: Senior reviewer trên cloud, tìm bug trước khi merge

Anthropic vừa mở /ultrareview trong Claude Code v2.1.86 — một lệnh duy nhất spin-up cả fleet agent trên cloud để soi code branch/PR, tìm race condition, logic lỗi, bottleneck hiệu năng. Mỗi finding được reproduce độc lập trước khi trả về. Pro & Max có 3 lần chạy free đến 5/5/2026, sau đó tính extra usage $5–$20 mỗi lần.

claude-codeultrareviewanthropic
6 phút đọc
Google Earth AI tại Cloud Next 2026: từ nghiên cứu sang nền tảng planetary intelligence
#4492025-10-07

Google Earth AI tại Cloud Next 2026: từ nghiên cứu sang nền tảng planetary intelligence

Google biến Earth AI thành production stack: 3 model imagery mới trong Vertex AI Model Garden, embeddings 330-D cho 17 quốc gia, Roads Insights mở cho tư nhân, và Vantor chạy Earth AI trong mạng air-gapped của chính phủ Mỹ.

google-earth-aigoogle-cloud-next-2026geospatial-ai
7 phút đọc
Google ra mắt TPU 8t và TPU 8i: chia đôi chip AI cho training và inference
#4212025-09-23

Google ra mắt TPU 8t và TPU 8i: chia đôi chip AI cho training và inference

Tại Google Cloud Next 2026, Google giới thiệu thế hệ TPU thứ 8 với hai chip riêng biệt: TPU 8t cho training (121 FP4 exaflops/pod, nhanh gấp 2.8x Ironwood) và TPU 8i cho inference (1,152 chip/pod, tối ưu cho agent swarms). Đây là lần đầu Google tách hai workload này ra phần cứng chuyên biệt.

google-tputpu-8ttpu-8i
7 phút đọc
Microsoft Research ra mắt AutoAdapt: tự động hoá tinh chỉnh LLM cho ngành, hơn AutoML 25% mà gần như không tốn thêm compute
#4182025-09-22

Microsoft Research ra mắt AutoAdapt: tự động hoá tinh chỉnh LLM cho ngành, hơn AutoML 25% mà gần như không tốn thêm compute

AutoAdapt là framework mới của Microsoft Research biến quy trình đưa LLM vào domain chuyên biệt — y tế, luật, cloud incident — từ 'nhiều tuần tinh chỉnh thủ công' thành một pipeline tự động, có ràng buộc ngân sách, đánh bại các baseline AutoML 25% trên 10 task với chỉ ~30 phút và ~$4 overhead mỗi task.

autoadaptmicrosoft-researchllm-fine-tuning
7 phút đọc
#4162025-09-21

PlanetScale Traffic Control: chặn truy vấn xấu trước khi nó hạ gục cả database

PlanetScale ra mắt Database Traffic Control cho Postgres — hệ thống budget tài nguyên theo thời gian thực, chặn query xấu trước khi nó chạy thay vì để timeout đốt CPU. Rule lan tới mọi replica trong 1-2 giây.

planetscalepostgresdatabase
7 phút đọc
#4062025-09-16

CrowdStrike mở rộng Cloud Detection & Response real-time lên Google Cloud

CrowdStrike vừa đưa Real-Time CDR — engine event-streaming phát hiện tấn công cloud trong vài giây — lên Google Cloud. Phản hồi nhanh hơn 89%, 100% phát hiện ở MITRE cloud eval, và hỗ trợ data sovereignty theo vùng.

crowdstrikegoogle-cloudcloud-security
6 phút đọc