#6322026-01-08
Sapiens2: Meta vừa thả ViT backbone human-vision chất lượng cao nhất trong public domain
Meta công bố Sapiens2 tại ICLR 2026 — model ViT 0.1B–5B params, resolution 1K/4K, pretrained trên 750M ảnh người. Cộng đồng gọi đây là 'first public release by a large lab that is non-trivial to replicate'. Pose +4 mAP, body-part seg +24.3 mIoU, normal error giảm 45.6%.