— 2025/07/04
百度此次开源的文心大模型4.5系列涵盖了多种规模配置,从0.3B参数的稠密型模型到47B激活参数的混合专家模型,为不同应用场景提供了灵活选择。这些新发布的模型可以在飞桨星河社区、Hugging Face等平台上下载和部署,同时百度智能云千帆大模型平台也提供了相应的API服务,极大降低了开发者的使用门槛。
早在今年2月,百度就已透露文心大模型4.5系列的推出计划,并预告于6月30日开源。尽管此次开源列表中未包含其升级版文心大模型4.5Turbo,但仍引发了开发者的热议。许多开发者认为,小参数版本模型非常适合内存受限的配置,且在性能上也表现不俗,有望与其他大型模型如DeepSeek V3和阿里Qwen进行竞争。
文心大模型4.5系列是一款原生多模态基础大模型,百度在多个测试中显示其表现超越了竞争对手GPT-4o。该模型不仅能理解文本,还能处理照片、视频等多种视觉信息,展示了其在多模态理解与生成方面的强大能力。这种全面的多模态支持为企业和开发者提供了更丰富的应用可能性。
专业评测显示,文心大模型4.5系列在图像理解、视频分析和文本生成等多个维度均表现出色,特别是在中文语境下的处理能力更是达到了行业领先水平。这种优异表现得益于百度在中文语料和多模态数据方面的深厚积累。
百度在开源文心大模型4.5系列的背后,主要依靠三大技术创新。首先是多模态异构MoE预训练,使模型能够有效捕捉文本和视觉模态的信息;其次是高效的基础设施,以实现快速训练和推理;最后是针对特定模态的后训练,使得模型在多样化的实际应用中表现更佳。
这些技术创新不仅提升了模型的整体性能,还大幅降低了训练和推理成本。混合专家架构的采用使得模型在保持高性能的同时,显著减少了计算资源消耗,为大规模部署提供了可能。
随着全球大模型市场竞争的加剧,百度的开源举措无疑对其他闭源模型供应商形成了压力,提升了整个行业的技术标准。这一行动也为广大开发者和研究人员提供了更多自由度,有助于他们更快速地进行模型迭代与应用,推动人工智能的进步。
业内专家认为,百度此次大规模开源将进一步激发国内大模型生态的活力,促进技术创新和应用落地。同时,这也体现了中国科技企业在全球人工智能竞争中的技术自信和开放态度,为构建更加繁荣的人工智能生态系统贡献了重要力量。