瑞士三强联合发布开源大模型 Apertus

瑞士三强联合发布开源大模型 apertus

瑞士三强联合发布开源大模型 Apertus

近日,瑞士联邦理工学院洛桑分校(EPFL)、苏黎世联邦理工学院(ETH Zurich)与瑞士国家超级计算中心(CSCS)携手推出了一款名为“Apertus”的大型开源语言模型。该名称源自拉丁语,意为“开放”,也正体现了该项目的核心理念。

与当前主流的美国大模型如OpenAI的GPT系列、Meta的Llama以及Anthropic的Claude不同,Apertus不仅仅在性能上追求突破,更因其极高的透明度而引发广泛关注。该模型的所有组成部分——包括模型权重、架构设计、训练代码、数据集来源,甚至完整的训练日志和文档记录——均已全面公开。

在人工智能迅猛发展的当下,许多商业模型仍深陷“黑箱”争议之中:关键训练细节被企业保密,外部研究者难以验证其结果或进行复现。而Apertus打破了这一行业惯例,采用完全开源的模式,致力于构建一个可信赖、可审查、可协作的技术平台。这种开放性使得全球的研究人员和开发者都能自由访问、修改并在此基础上开展创新工作,从而推动AI领域的集体进步。

项目团队强调,Apertus的发布不仅是为了服务学术研究,更是为了激发全球AI社区对开源精神的重视与参与。通过降低技术获取门槛,让更多机构和个人能够平等使用先进模型,Apertus旨在打造一个更加包容、透明且可持续发展的AI生态体系。

网友留言(0 条)

发表评论