最新资讯AI工具派快讯

百度文心大模型5.1发布:登顶多个榜单,预训练成本仅为业界 6%_腾讯新闻

【TechWeb】5月9日消息,百度文心大模型5.1 正式发布,其继承文心5.0 知识,显著降低预训练成本,将总参数压缩至约1/3、激活参数压缩至约1/2,仅使用业界同规模模型约6% 的预训练成本,实现同级别模型基础效果领先。登录文心一言官网即可与文心5.1模型对话体验最新能力。开发者可以通过千帆大模型平台修改model_name为erni...

作者:news.qq.com浏览:4,667发布日期:2026-05-09 14:03喜欢:271
最新资讯4667 浏览271 喜欢
百度文心大模型5.1发布:登顶多个榜单,预训练成本仅为业界 6%_腾讯新闻

【TechWeb】5月9日消息,百度 文心大模型5.1 正式发布,其继承文心5.0 知识,显著降低预训练成本,将总参数压缩至约1/3、激活参数压缩至约1/2,仅使用业界同规模模型约6% 的预训练成本,实现同级别模型基础效果领先。

登录文心一言官网即可与文心5.1模型对话体验最新能力。开发者可以通过千帆大模型平台修改model_name为ernie-5.1即可调用API服务。

另外,从今天起,文心大模型 5.1 将陆续在超过十个创意生产智能体平台上线,包括 ISEKAI ZERO(全球领先的 AI 角色扮演互动平台)、Mulan AI(创意智能体平台)、谛听幻流(AI 原生创意画布)和 Storymaster(AI 短剧生成平台)等。欢迎创作者和用户试用。

5月9日,文心大模型5.1在 Arena Search 排行榜上获得1223分,位居全球第4位,在中国模型中排名第1。

文心大模型 5.1 在多个权威行业基准测试中均取得了强劲的成绩,尤其是在智能体能力、知识、推理和深度搜索方面表现突出。

在 τ³-bench 和 SpreadsheetBench-Verified 智能体评估任务中,文心大模型 5.1 超越了 DeepSeek-V4-Pro,其智能体能力已接近领先闭源模型的水平。在 Search Arena 排行榜上也表现极其出色。

世界知识与创意写作能力方面,在 GPQA 和 MMLU-Pro 评估中,文心大模型 5.1 的性能接近领先闭源模型。在内部评估中,文心大模型 5.1 的创意写作能力已接近 Gemini 3.1 Pro。

推理能力接近领先闭源模型,在颇具挑战性的数学竞赛基准 AIME26(使用工具)上,文心大模型 5.1 得分 99.6,仅次于 Gemini 3.1 Pro。

文心大模型 5.1 衍生自文心大模型 5.0,从文心大模型 5.0 的多维弹性子模型矩阵中提取出最优子网络架构,在有效继承文心大模型 5.0 所编码知识与能力的同时,显著降低了预训练成本。

研发团队提出了一种创新的“一次训练,处处部署”(Once-For-All)弹性训练框架。传统方法需要为不同规模的模型分别进行预训练,而文心大模型 5.0 则通过动态采样机制,在一次预训练过程中联合优化大量具有不同深度、专家容量和路由稀疏度的子模型,构建了一个覆盖不同参数规模和计算预算的子模型矩阵。

弹性深度:训练期间,随机改变激活的 Transformer 层数,使不同深度的子模型能够共享权重,自适应地学习深层与浅层表示的平衡。

弹性宽度/专家容量:通过改变参与路由的专家数量,弹性控制 MoE 层中的有效专家容量。通过动态采样专家子集,模型学习在完整和缩减的专家池配置下运行,从而提高专家利用效率。

弹性稀疏度:通过可变 Top-k 路由机制灵活调整激活的专家数量。激活较少专家可降低推理成本、提升解码效率,而激活更多专家则能增强模型能力,从而实现推理开销与性能的动态平衡。

基于这一突破,文心大模型 5.1 将总参数量压缩至文心大模型 5.0 的约三分之一,激活参数量压缩至约二分之一,预训练计算成本仅为同规模同类模型的 6%。与文心大模型 5.0 相比,推理成本显著降低,同时在同规模模型中仍能实现领先性能。

文章来源: https://news.qq.com/rain/a/20260509A04R1B00

来源与声明

本站快讯内容主要用于行业资讯整理与信息聚合,部分内容来源于公开网络与第三方平台,仅供学习、参考与行业交流使用。

如相关内容涉及版权、署名或权益问题,请通过站点联系邮箱与我们联系,我们会在核实后尽快处理。

关联工具

文中相关方向,可以先从这些工具开始试

文心大模型 是一款围绕 AI 对话问答、AI 学术搜索 展开的 AI对话助手 工具,公开页面更强调它在 学术检索与学习辅助、代码开发与自动化工作流 这类任务里的实际用途。从页面信息来看,中文使用场景与中文内容支持会更清晰一些。

百度文心助手 - 文心助手网页版入口 是一款围绕 AI 对话问答、AI PPT 生成 展开的 国产模型与中文生态 工具,公开页面更强调它在 日常 AI 问答与资料整理、图片创作与视觉内容生成 这类任务里的实际用途。从页面信息来看,中文使用场景与中文内容支持会更清晰一些。

百度AI搜索 是一款围绕 AI 联网搜索 展开的 AI搜索与问答 工具,公开页面更强调它在 日常 AI 问答与资料整理、图片创作与视觉内容生成 这类任务里的实际用途。从页面信息来看,中文使用场景与中文内容支持会更清晰一些。

百度网盘 可以先理解为一款面向 办公文档、PPT、表格处理 的 AI对话助手 工具,当前公开信息主要围绕 智能问答与内容生成、任务辅助与信息整理 这些能力展开。如果你主要在中文环境里工作,可优先确认中文输入、输出和界面是否符合预期。

百度AI同传助手 可以先理解为一款面向 日常 AI 问答与资料整理、翻译、本地化与多语言处理 的 AI对话助手 工具,当前公开信息主要围绕 AI 对话问答、文件上传理解 这些能力展开。如果你主要在中文环境里工作,可优先确认中文输入、输出和界面是否符合预期。

百度用户体验中心 是一款围绕 智能问答与内容生成、任务辅助与信息整理 展开的 AI对话助手 工具,公开页面更强调它在 日常 AI 工具使用、信息整理与内容处理 这类任务里的实际用途。从页面信息来看,中文使用场景与中文内容支持会更清晰一些。

相关推荐

继续看同主题内容

文章评论

阅读后的真实反馈

支持继续回复展开讨论,审核通过后会展示在页面中。

访
写下你的看法当前身份:访客
0 条评论
全部评论0 条
暂时还没有评论,欢迎来留下第一条看法。