谷歌 DeepMind 推出 MoR 架构:有望大幅提升大型语言模型的效率

谷歌DeepMind推出创新架构Mixture-of-Recursions(MoR),通过动态token级路由和递归深度分配,在保持参数高效的同时提升模型性能。...

2025-07-17
18
0
文章配图
1