国内团队创造历史!“人类最后的考试” 首次得分突破30分,AI竞争再升级!

上海交大与深势科技团队开发的X-Master智能体系统在超高难度AI测试'HLE'中创下32.1分新纪录,首次突破30分大关。该系统采用工具增强型推理和多智能体协作架构,能

文章配图
1