福州弘博通科技有限公司

作者 | 周愚

编辑 | 邓咏仪

36 氪获悉，9 月 25 日，百川智能正式发布了 Baichuan2-53B 闭源大模型，同时还一并开放了该模型的 API 接口，正式进军 To B 领域，开启商业化进程。

百川依旧保持着 " 小步快跑 " 的模型发布速度。这已是自 4 月 10 日成立以来，百川智能发布的第 6 款大模型，平均下来几乎是每 28 天推出一个大模型。

对比上月初发布的 Baichuan1-53B，Baichuan2-53B 在数学、逻辑推理等能力上均有显著提升，还在模型幻觉方面表现良好。百川智能称，该模型是 " 目前国内幻觉问题最低的大模型 "。

据百川智能，在 Baichuan1-53B 的基础上，Baichuan2-53B 的逻辑推理能力提升了 100%，数学能力提升了 31%。此外，Baichuan2-53B 在语言理解能力、文本创作能力和知识问答能力上，也分别有 29%、18% 和 9% 的提升。

图源：企业供图

在模型幻觉方面，Baichuan2-53B 采取了两方面的改进措施。一方面，百川增加了模型的数据规模、提升数据质量，另一方面也通过调用搜索等外部工具让模型能够获取实时信息。

百川智能使用 FacTool 评测后的结果显示，Baichuan2-53B 的综合得分为 140.5，在主流基础大模型中仅排在 GPT-4 之后，处于国内领先水平。

据悉，FacTool 是由上海交通大学、卡内基梅隆大学、香港城市大学、Meta 等机构学者共同提出的一款通用框架，能够查核大模型生成内容的事实准确性。

具体而言，Baichuan2-53B 独创了一套数据质量体系，以低质、优质为标准将数据进行分类，确保 Baichuan2-53B 始终使用优质数据进行预训练。信息获取方面，Baichuan2-53B 也对指令意图理解、智能搜索和结果增强等多个模块进行了升级。

除了能力升级之外，开放 API 接口也是此次发布的一大亮点。企业和开发者可以通过 API 将 Baichuan2-53B 集成至他们的应用程序和服务中，适配用户在智能客服、智能写作、智能推荐等多种不同场景的需求。

在安全合规问题方面，作为首批通过《生成式人工智能服务管理暂行办法》备案的大模型企业，百川智能为 Baichuan2-53B 打造了覆盖大模型预训练、精调、推理全周期的安全增强。

值得一提的是，Baichuan2-53B 的 API 接口对 OpenAI 的接口高度兼容，客户可以实现快速迁移，降低模型的部署和转换成本。

新闻