Tất cả bài viết

// Popular Articles

#tau-bench

#6542026-01-19

Grok Voice Think Fast 1.0 quét sạch τ-voice Bench: 67.3% overall, 73.7% telecom — bỏ xa OpenAI và Google

xAI ra mắt grok-voice-think-fast-1.0 và lên #1 trên τ-voice Bench của Sierra với 67.3% overall, 62.3% retail, 66% airline và 73.7% telecom — gấp đôi GPT Realtime 1.5 và Gemini 3.1 Flash Live ở domain khó nhất. Dưới đây là full context, số liệu, và giới hạn.

grok-voicexaivoice-ai

7 phút đọc

#6082025-12-27

OpenAI's gpt-realtime-1.5 opens a 20+ point lead on Sierra's voice leaderboard

OpenAI engineer Eric (@veggie_eric) says the newest Realtime voice model is 20+ points ahead of the nearest competitor on Sierra's τ³-Bench — a "pretty massive upgrade" from the December OG, with big realism and tool-calling gains.

gpt-realtimeopenaivoice-ai

6 phút đọc