// Popular Articles
LiteRT unlocks the NPU: 100× faster on-device AI shipping in Google Meet, Epic Games & Argmax
Google just promoted LiteRT's NPU acceleration to GA. Real apps already shipping on it: Google Meet runs a 25x bigger Ultra-HD segmentation model, Epic Games hits 30 FPS MetaHuman facial capture on Android, and Argmax's speech SDK gets a 2x speedup. Here's what changed and why it matters.
AI agent sống trong browser: kiến trúc Transformers.js + Gemma 4 của Nico Martin
Nico Martin open-source một Chrome extension chạy AI agent hoàn toàn local bằng Gemma 4 E2B trên Transformers.js + WebGPU. Đọc tabs, history, page content, tool calling — không server, không API key. Phần hay không phải là nó chạy được, mà là cách nhét LLM đa gigabyte vào service worker của extension và chia sẻ qua mọi tab.
Brave Ocelot: mô hình tóm tắt web mã nguồn mở, chạy ngay trên máy bạn
Brave vừa open-source Ocelot — một mô hình AI do chính Brave huấn luyện, chuyên làm một việc duy nhất: tóm tắt nội dung web, và quan trọng hơn, chạy hoàn toàn trên thiết bị người dùng. Không gửi nội dung trang lên cloud, không cần tài khoản, không tính phí API.
OpenAI ra mắt Privacy Filter: model mã nguồn mở chạy ngay trong trình duyệt để che PII
OpenAI vừa open-source Privacy Filter — model 1.5B tham số (50M active) chạy được trong browser qua WebGPU, đạt 96% F1 trên PII-Masking-300k, kèm CLI `opf`, tất cả dưới giấy phép Apache 2.0.
Atomic Mail becomes the first email client to run AI fully on-device via Chrome's Gemini Nano
Flip one toggle in Privacy Center and every AI feature — write, summarize, translate, security scan — runs locally through Chrome's bundled Gemini Nano. No server calls. No data leaving your machine. Zero cost. Here's what just shipped, how it works, and why it matters for privacy-first email.
Gemma 4: mô hình mở 31B của Google đánh bại đối thủ 400B và chạy offline trên điện thoại
Google DeepMind ra Gemma 4 ngày 2/4/2026 dưới giấy phép Apache 2.0. Bản 31B Dense đạt 89,2% AIME 2026, 80% LiveCodeBench v6, Elo 1452 trên Arena AI và đứng #3 bảng xếp hạng open model — trong khi bản E2B chạy offline trên Raspberry Pi, điện thoại với context 256k cho các dòng MoE/Dense.
Gemma 4 chạy offline trên iPhone: 1.5GB, không cần mạng, không cần cloud
Google vừa đưa Gemma 4 E2B và E4B — mô hình mở đa phương tiện — xuống iPhone. Tải ~1.5 GB là xong, chat–nhìn ảnh–nghe giọng hoàn toàn offline. Đây là cái nhìn kỹ thuật và trải nghiệm thực tế.
Liquid AI's car-cockpit voice assistant runs fully offline on a laptop — two tiny models, zero cloud
A 1.5B audio model (LFM2.5-Audio) and a 1.2B tool-calling model (LFM2-1.2B-Tool) drive a real-time, voice-controlled car cockpit demo entirely on-device. No internet, no API keys, no cloud. Here's what's actually inside.
MOSS-TTS-Nano: Open TTS 100M params chạy local, 48kHz stereo, không cần GPU
OpenMOSS vừa thả model TTS 0.1B params Apache-2.0, streaming realtime trên CPU 4-core, 48kHz stereo, 20 ngôn ngữ. Bản ONNX mới chạy mượt trên 1 core MacBook Air M4. Đây là bước ngoặt cho on-device voice AI.