🧠
推理能力
1501 Elo领跑LMArena,GPQA Diamond 91.9%,Deep Think模式突破智能边界
👁️
多模态理解
原生整合文本/图像/视频/音频/代码,100万token上下文窗口
💻
编码能力
WebDev Arena 1487 Elo,SWE-bench 76.2%,最强氛围编码模型
🤖
Agent能力
Terminal-Bench 54.2%,Vending-Bench榜首,多步骤任务规划
📚
长上下文
100万token窗口,可处理整本书籍、代码库、超长视频