// Popular Articles
Stackelberg PPO: robot tự mọc tay để đẩy, mọc chân để đi — chỉ với 1 reward duy nhất
Schmidhuber và team KAUST/IDSIA biến co-design body+brain của robot thành một game leader-follower. Kết quả: robot tự tiến hoá thành tay đẩy hộp, chân di chuyển — vượt SoTA 20.66% trung bình, 32.02% trên task 3D phức tạp, dùng ít hơn 39% sample. Paper poster ICLR 2026 ngày 25/04.
SimToolReal: Robot Stanford học dùng công cụ chưa từng thấy — không cần training riêng cho từng task
Stanford & Cornell công bố SimToolReal — một policy RL duy nhất train hoàn toàn trong simulation nhưng có thể zero-shot cầm búa, marker, cờ-lê chưa từng thấy ngoài đời, vượt baseline 37% qua 120 thử nghiệm thật. Đây là bước nhảy quan trọng cho dexterous manipulation: thay vì engineer từng reward function cho từng tool, một policy phổ quát học cầm-xoay-thao-tác bất kỳ object dạng cuboid/cylinder nào, rồi áp dụng zero-shot vào tool thật.
Sony AI ra mắt Ace: robot đầu tiên hạ gục người chơi bóng bàn đẳng cấp elite
Ace của Sony AI vừa được công bố trên Nature ngày 22/4/2026 — robot tự hành đầu tiên đánh bại vận động viên bóng bàn elite. 9 camera dựng vị trí bóng 3D, 3 hệ gaze control đọc xoáy theo thời gian thực, 32 ms một vòng quyết định, và hàng ngàn giờ tự học trong mô phỏng — không có demo nào từ con người.
Helix 02 tự dọn phòng khách: một mạng neural, 61 hành động, zero code mới
Figure AI vừa công bố demo mới: robot Figure 03 chạy trên Helix 02 tự xịt lau bàn, hốt đồ chơi, ném gối lên sofa, xoay remote bấm tắt TV — tất cả từ một neural network duy nhất, không can thiệp con người.
LeRobot vừa ship AGENT_GUIDE.md — giờ AI agent biết cách dạy bạn setup robot SO-101
Hugging Face nhét toàn bộ tri thức setup robot SO-101, thu dữ liệu và chọn policy theo VRAM vào một file AGENT_GUIDE.md. Claude Code, Cursor, Copilot đọc xong là có thể hướng dẫn bạn từ A–Z. Không cần PhD, chỉ cần hỏi.
FluxVLA Engine: LimX Dynamics mở mã nguồn framework chuẩn hóa cho VLA và embodied AI
LimX Dynamics vừa open-source FluxVLA Engine — framework full-stack gom data, training, sim, và deploy robot về một config duy nhất. Hỗ trợ GR00T, Pi0.5, OpenVLA, Qwen-VL; tăng tốc inference 5–10× nhờ Triton + CUDA Graph; LIBERO avg 98.4. Training-to-deploy chỉ ~30 phút.