瑞士发布国家级开源大模型Apertus:打造AI公共基础设施新标杆
瑞士国家情报局(SWI)于2025年9月4日正式发布全球首个国家级开源大语言模型 Apertus(拉丁语意为“开放”),旨在为人工智能领域树立“可信赖且具全球影响力的开放模型新标杆”。该模型由瑞士联邦理工学院(EPFL)、苏黎世联邦理工学院(ETH Zurich)及瑞士国家超级计算中心(CSCS)联合研发,其源代码、训练数据、模型权重及完整开发流程均通过HuggingFace平台向公众开放,成为替代OpenAI的ChatGPT等闭源模型的重要选择。
核心特性:开放透明与多语言能力
- 全栈开源:
Apertus严格遵循开放透明原则,用户可审查模型架构、训练数据及流程细节,显著区别于主流闭源模型(如GPT-4)的“黑箱”模式。这一设计呼应了全球对AI可解释性与安全性的迫切需求。 - 千语级覆盖:
模型支持超过1000种语言的精准处理,尤其注重对小语种和稀缺资源的包容性,致力于消除语言技术鸿沟。 - 双版本适配:
提供面向个人用户的轻量版和适用于复杂场景的企业版,兼顾效率与性能。
可持续性与公共属性
- 绿色训练:依托瑞士可再生能源驱动的超级计算机进行训练,将碳足迹降至最低。
- 公共基础设施定位:项目核心倡导者约书亚・谭(Joshua Tan)强调,Apertus是“由公立机构打造、服务于公共利益”的AI基础设施,目标是将AI转化为如公路、水电般的公共资源。
技术背景与行业意义
Apertus的诞生建立在开源生态的长期积累上。此前,Meta的LLaMA模型已证明仅用公开数据可训练出媲美GPT-3的模型(LLaMA-13B性能超越175B参数的GPT-3),而Apertus进一步将“开源透明”与“公共利益”结合,挑战了以GPT-4为代表的闭源商业垄断模式。开源模型可降低技术使用门槛,促进创新协作,但可持续盈利方面的挑战仍需观察。
官网:https://www.swiss-ai.org/apertus
发表回复