#4122025-09-19
Looped Transformer chính là EBM inference: một phương trình, hai thế giới
Looped transformer và Energy-Based Model thực ra cùng một thuật toán gradient descent. Nhưng sự tương đương này không tự động đúng — nó đòi một ràng buộc Jacobian mà transformer thường không thỏa.