星知

logo
logo
登录

大模型智能体告别盲目堆叠!港中文团队发布SLIM框架,动态管理外部技能生命周期

香港中文大学团队提出SLIM框架,通过“保留、退休、扩展”机制动态管理大模型智能体外部技能,提升复杂任务执行效率。
发布时间:2026/06/02 03:31|分类:人工智能
大模型智能体告别盲目堆叠!港中文团队发布SLIM框架,动态管理外部技能生命周期
大模型智能体(LLM Agent)正从“会聊天”迈向“会做事”的连续决策阶段,外部能力管理成为关键难题。香港中文大学团队在论文《Dynamic Skill Lifecycle Management for Agentic Reinforcement Learning》中提出“SLIM”动态技能生命周期管理框架,避免盲目堆叠技能或完全依赖模型参数。SLIM将外部技能视为具备生命周期的动态能力系统,在强化学习训练中让模型自主决定技能的保留、退休与扩展。其机制包括:基于当前状态检索通用或任务专属技能,使用GRPO更新策略,并通过“留一法”审计技能贡献;贡献高则保留,贡献低或产生干扰则退休,持续失败的新场景则总结并扩展新技能。实验显示,SLIM整体平均超过现有最佳方法7.1个百分点。在ALFWorld家庭环境任务中成功率达87.5%,高于SkillRL的75.0%;在SearchQA任务中也展现竞争力。业内认为,SLIM将外部技能库从固定辅助工具升级为可与策略协同优化的训练对象,为具身智能与大模型Agent产业化提供新思路。
人工智能星知