Tất cả bài viết

// Popular Articles

#robotics

#7602026-03-10

Stackelberg PPO: robot tự mọc tay để đẩy, mọc chân để đi — chỉ với 1 reward duy nhất

Schmidhuber và team KAUST/IDSIA biến co-design body+brain của robot thành một game leader-follower. Kết quả: robot tự tiến hoá thành tay đẩy hộp, chân di chuyển — vượt SoTA 20.66% trung bình, 32.02% trên task 3D phức tạp, dùng ít hơn 39% sample. Paper poster ICLR 2026 ngày 25/04.

stackelberg-ppomorphology-control-co-designiclr-2026

6 phút đọc

#7272026-02-24

SimToolReal: Robot Stanford học dùng công cụ chưa từng thấy — không cần training riêng cho từng task

Stanford & Cornell công bố SimToolReal — một policy RL duy nhất train hoàn toàn trong simulation nhưng có thể zero-shot cầm búa, marker, cờ-lê chưa từng thấy ngoài đời, vượt baseline 37% qua 120 thử nghiệm thật. Đây là bước nhảy quan trọng cho dexterous manipulation: thay vì engineer từng reward function cho từng tool, một policy phổ quát học cầm-xoay-thao-tác bất kỳ object dạng cuboid/cylinder nào, rồi áp dụng zero-shot vào tool thật.

simtoolrealstanforddexterous-manipulation

7 phút đọc

#4232025-09-24

Sony AI ra mắt Ace: robot đầu tiên hạ gục người chơi bóng bàn đẳng cấp elite

Ace của Sony AI vừa được công bố trên Nature ngày 22/4/2026 — robot tự hành đầu tiên đánh bại vận động viên bóng bàn elite. 9 camera dựng vị trí bóng 3D, 3 hệ gaze control đọc xoáy theo thời gian thực, 32 ms một vòng quyết định, và hàng ngàn giờ tự học trong mô phỏng — không có demo nào từ con người.

sony-airoboticsreinforcement-learning

7 phút đọc

#3992025-09-12

Helix 02 tự dọn phòng khách: một mạng neural, 61 hành động, zero code mới

Figure AI vừa công bố demo mới: robot Figure 03 chạy trên Helix 02 tự xịt lau bàn, hốt đồ chơi, ném gối lên sofa, xoay remote bấm tắt TV — tất cả từ một neural network duy nhất, không can thiệp con người.

figure-aihelix-02humanoid-robot

7 phút đọc

#3982025-09-12

LeRobot vừa ship AGENT_GUIDE.md — giờ AI agent biết cách dạy bạn setup robot SO-101

Hugging Face nhét toàn bộ tri thức setup robot SO-101, thu dữ liệu và chọn policy theo VRAM vào một file AGENT_GUIDE.md. Claude Code, Cursor, Copilot đọc xong là có thể hướng dẫn bạn từ A–Z. Không cần PhD, chỉ cần hỏi.

lerobothugging-faceso-101

6 phút đọc

#1552025-05-13

FluxVLA Engine: LimX Dynamics mở mã nguồn framework chuẩn hóa cho VLA và embodied AI

LimX Dynamics vừa open-source FluxVLA Engine — framework full-stack gom data, training, sim, và deploy robot về một config duy nhất. Hỗ trợ GR00T, Pi0.5, OpenVLA, Qwen-VL; tăng tốc inference 5–10× nhờ Triton + CUDA Graph; LIBERO avg 98.4. Training-to-deploy chỉ ~30 phút.

fluxvlalimx-dynamicsembodied-ai

7 phút đọc