// Popular Articles
Array Decomposition cho MoM: mô phỏng mảng anten 6G nhẹ bộ nhớ gần 500 lần
Nhóm KTH & Saab vừa công bố trên IEEE TAP (02/2026) một phương pháp MoM mới cho mảng anten hữu hạn có phần tử nối điện. Với 9 thành phần lặp và ma trận block Toeplitz đa lớp, mảng 32×32 chỉ cần 3.97 GB thay vì 1.97 TB — chuẩn bị cho kỷ nguyên anten 6G hơn 1,000 phần tử.
LiteRT unlocks the NPU: 100× faster on-device AI shipping in Google Meet, Epic Games & Argmax
Google just promoted LiteRT's NPU acceleration to GA. Real apps already shipping on it: Google Meet runs a 25x bigger Ultra-HD segmentation model, Epic Games hits 30 FPS MetaHuman facial capture on Android, and Argmax's speech SDK gets a 2x speedup. Here's what changed and why it matters.
Database phân tán đồng bộ dữ liệu như thế nào: Read-Repair và Hinted-Handoff
Consistency là bài toán khó nhất của distributed database. Hai cơ chế được dùng để kéo replica về cùng một trạng thái: read-repair khi đọc và hinted-handoff khi ghi. Đây là cách chúng hoạt động và lý do cả hai vẫn chỉ là best-effort.
Smallest AI lands natively in Pipecat: Lightning TTS + Pulse STT drop into your voice agent pipeline
Pipecat just added first-class support for Smallest AI. Lightning TTS (sub-100ms TTFA, 15 languages) and Pulse STT (sub-70ms TTFT, 36 languages) now plug straight into your voice agent pipeline — no custom adapter. Here's what that actually unlocks for latency-sensitive voice bots.
Vision Banana: Google DeepMind biến Nano Banana Pro thành mô hình thị giác đa năng đánh bại SAM 3 và Depth Anything
Bằng cách quy mọi tác vụ dense vision về một bài toán duy nhất — sinh ảnh RGB — nhóm Google DeepMind fine-tune Nano Banana Pro thành Vision Banana, một mô hình đa nhiệm đạt SOTA trên depth, normals và segmentation, vượt mặt cả SAM 3 và Depth Anything mà vẫn giữ nguyên khả năng tạo ảnh.
API Gateway: Why Large Systems Don't Expose Every Service Directly
One entry point between clients and a fleet of microservices. Why Netflix runs 80+ Zuul clusters at 1M+ requests/second, how the pattern differs from a load balancer, and when skipping the gateway is actually the right call.
DFlash đã chạy được trên llama.cpp: block-diffusion draft, speedup tới 8× cho Qwen3
spiritbuun vừa push bản triển khai DFlash — speculative decoding kiểu block-diffusion — vào fork buun-llama-cpp. Một dòng lệnh --spec-type dflash, draft model 5 layer, block 16 token mỗi forward pass, tốc độ gấp 6–8 lần so với decode thường và hơn EAGLE-3 khoảng 2.5×.
TinyGPU v3.0: GPU ASIC 290k transistor có Programmable Pixel Shader — tribute GeForce 3 sau đúng 25 năm
Pongsagon Vichit vừa công bố TinyGPU v3.0 — GPU ASIC chỉ ~290.000 transistor nhưng đã có programmable Pixel Shader, verified trên FPGA và nộp vào TinyTapeout May shuttle. Kèm demo Chameleon tribute GeForce 3 — GPU shader đầu tiên ra mắt đúng 25 năm trước.
ZCAM: Succinct's iPhone app cryptographically signs every photo — so you can prove it's real
Succinct just launched ZCAM, a free iPhone app that signs photos and videos inside the Secure Enclave the moment you capture them. Any edit — human or AI — breaks the signature. Here's how it works and why it matters in a year when 7 commercial AI detectors lose up to 96% accuracy against trivial edits.
Vision Banana: Google DeepMind biến image generation thành nền tảng mới cho Computer Vision
Google DeepMind vừa công bố Vision Banana — một model unified được fine-tune nhẹ từ Nano Banana Pro, giải mọi bài toán vision (segmentation, depth, surface normal) bằng cách coi chúng là bài toán sinh ảnh. Và nó vượt qua cả Segment Anything lẫn Depth Anything.