谷歌 DeepMind 推出 MoR 架构:有望大幅提升大型语言模型的效率
谷歌DeepMind推出创新架构Mixture-of-Recursions(MoR),通过动态token级路由和递归深度分配,在保持参数高效的同时提升模型性能。...
2025-07-17
18
0

1