星知

logo
logo
登录

轻量级模型实现重大突破!香港科技大学与快手联合推出EvoSearch进化搜索算法,重新定义AI图像生成效率

2025/06/13

传统AI生成模型面临的挑战与瓶颈

当前AI图像生成技术主要依托两大核心架构:扩散模型和流模型。扩散模型采用渐进式去噪机制,通过多步骤处理将噪声逐步转化为清晰图像;流模型则运用连续变换技术,直接将随机噪声重塑为目标图像内容。

轻量级模型实现重大突破!香港科技大学与快手联合推出EvoSearch进化搜索算法,重新定义AI图像生成效率

为了提升模型性能,行业内普遍采用两种主要策略。训练阶段的优化主要通过扩大模型规模和增加训练数据量来实现,但这种"规模驱动"的方法成本高昂且已接近资源极限。推理阶段的优化包括Best-of-N采样技术(从N个生成结果中选择最优)和粒子采样方法(维护多个候选并筛选优质个体)等。

EvoSearch算法:生物进化理论在AI领域的创新应用

EvoSearch的核心突破在于将达尔文进化理论巧妙融入AI生成流程。该算法将图像生成过程模拟为生物进化:首先创建初始"种群"(随机噪声集合),随后通过"适应度评估"对中间产物进行质量评分,接着执行"自然选择"保留优质个体,最终通过精心设计的"变异机制"产生新的候选解决方案。

变异操作构成了EvoSearch技术的关键突破。针对初始噪声阶段,系统通过引入适量高斯噪声实现有效变异;对于去噪过程的中间状态,则借鉴随机微分方程采样的随机性注入机制,为中间状态添加精确可控的扰动。这种精巧设计既确保了新区域的探索能力,又保持了优秀"遗传特征"的传承。

相较于传统方法,EvoSearch展现出三项显著优势:主动探索机制替代被动筛选,能够突破初始候选池的限制;智能平衡探索与利用关系,有效避免过早陷入局部最优解;强大的通用适配性,支持各类扩散模型和流模型,无需修改底层架构或进行额外训练。

实验验证:全面超越现有基准方法

研究团队在图像和视频生成任务中进行了comprehensive测试,结果表明EvoSearch在所有关键指标上都显著超越现有基准方法。图像生成测试显示,随着推理计算资源的增加,EvoSearch生成的图像质量和文本匹配精度持续稳定提升,而其他方法很快遭遇性能瓶颈。

在视频生成方面,EvoSearch的表现更加令人瞩目。无论搭配万象Wan1.3B模型还是混元HunyuanVideo13B模型,EvoSearch的生成质量都大幅超越基准方法。最具说服力的是,当为Wan1.3B模型分配与Wan14B模型相同的推理时间资源时,前者结合EvoSearch的组合效果竟能与后者持平甚至超越。

值得强调的是,即使在评价指标与EvoSearch搜索过程中使用的奖励函数不完全匹配的情况下,该方法仍展现出优秀的泛化能力,不易受特定奖励函数的误导。在人工评估环节,EvoSearch生成的视频在视觉质量、动作流畅性、文本对齐度和整体质量等维度都获得了更高的胜率认可。

开启AI创作的"智能进化"新时代

EvoSearch的成功为AI生成领域提供了重要的技术启示。在训练成本持续攀升的当下,通过在推理阶段投入更多计算资源来提升模型性能成为极具价值的探索方向。将生物进化中的选择与变异理念引入AI生成领域,能够有效突破传统搜索方法的固有局限。

这项技术的成功充分体现了对扩散和流模型去噪过程的深度理解。EvoSearch准确把握了这些模型在去噪过程中的状态空间结构特征,据此设计了针对性的变异策略,从而能够更高效地探索庞大的可能性空间。研究团队指出,未来的改进方向包括开发更智能的变异策略、更好地平衡探索效率与计算成本等。

EvoSearch技术向业界展示了一个重要发展趋势:即使不盲目追求更大规模的模型和更海量的训练数据,通过在推理阶段运用更智慧的搜索策略,依然可以深度挖掘AI模型的潜在能力。EvoSearch正在开启AI创作的"智能进化"时代,让轻量级模型也能创造出令人惊艳的优质作品。

最新发布