#7122026-02-17
Aletheia: AI của Google DeepMind giải 6/10 bài toán mới và đạt 91.9% IMO-ProofBench
Aletheia, agent toán học chạy trên Gemini 3 Deep Think, vừa tự giải 6/10 bổ đề chưa từng công bố trong FirstProof và đạt 91.9% trên IMO-ProofBench Advanced — bỏ xa GPT-5.2 (35.7%). Một bước ngoặt cho automated theorem proving không cần can thiệp con người.