新闻资讯星知智能体登录

瑞士发布国家级开源大语言模型Apertus：涵盖1000种语言，15万亿Token训练数据

— 2025/09/05

模型概况

瑞士Apertus大语言模型具有以下核心特征：

国家级项目：由瑞士洛桑联邦理工学院等机构联合打造
完全开源：采用开源协议，促进全球AI技术发展
多语言支持：训练数据涵盖超1000种语言
大规模数据：总token量达15万亿，非英语数据占比40%

瑞士发布国家级开源大语言模型Apertus：涵盖1000种语言，15万亿Token训练数据

技术规格

Apertus模型提供两个不同规模的版本：

80亿参数版本：适合资源受限环境，提供基础AI能力
700亿参数版本：高性能版本，支持复杂任务处理
多语言架构：专门针对多语言场景优化设计
开源协议：采用开放协议，支持商业和研究使用

数据优势

Apertus在训练数据方面具有独特优势：

语言覆盖：涵盖超1000种语言，包括小语种和方言
数据规模：15万亿Token的训练数据量
多语言平衡：非英语数据占比40%，避免英语数据偏见
文化多样性：包含不同文化和地区的语言数据

应用场景

Apertus模型适用于多种应用场景：

多语言翻译：支持1000多种语言之间的翻译
跨文化沟通：促进不同文化背景的交流
语言学研究：为语言学研究提供强大工具
全球化应用：支持全球化企业的多语言需求

开源意义

Apertus的开源发布具有重要意义：

技术民主化：让更多研究者和开发者能够使用先进AI技术
多语言AI发展：推动多语言AI技术的普及和发展
学术研究支持：为学术研究提供强大的基础模型
全球合作：促进国际AI技术合作和交流

市场影响

Apertus的发布对AI市场产生重要影响：

多语言AI标准：为多语言AI模型设定新的技术标准
开源生态：丰富开源AI模型生态，提供更多选择
技术竞争：推动AI大模型领域的技术竞争
应用创新：为多语言AI应用创新提供基础

未来发展

在开源模式下，Apertus未来发展前景广阔：

社区贡献：通过开源社区持续改进和优化
应用扩展：支持更多多语言AI应用场景
技术迭代：持续更新和升级模型能力
生态建设：构建围绕Apertus的开发生态

瑞士Apertus大语言模型的发布标志着多语言AI技术的重要突破，其开源特性和强大的多语言能力将为全球AI技术发展做出重要贡献。

最新发布

编程界的“大一统”?GitHub 集成 Claude 与 Codex，开启多模型协作新纪元

编程界的“大一统”?GitHub 集成 Claude 与 Codex，开启多模型协作新纪元

2026/02/06

腾讯游戏寒假管控升级：引入 AI 辅助功能，家长可实现“一键管控”

腾讯游戏寒假管控升级：引入 AI 辅助功能，家长可实现“一键管控”

2026/02/06

苹果 CEO 蒂姆·库克暗示:全新 AI 硬件品类即将面世

苹果 CEO 蒂姆·库克暗示:全新 AI 硬件品类即将面世

2026/02/06

Anthropic 发布 Claude Opus 4.6：死磕编程与办公，自主性再上新台阶

Anthropic 发布 Claude Opus 4.6：死磕编程与办公，自主性再上新台阶

2026/02/06

瑞士发布国家级开源大语言模型Apertus：涵盖1000种语言，15万亿Token训练数据