当前位置：网站首页技术文章正文

百度发布首个知识增强千亿大模型，参数规模达2600亿

来源：互联网发布时间：2024-06-29 09:43:41

作为当前人工智能发展的重要方向，预训练大模型已成为 AI 领域的技术新高地。

AI 大模型就像工业时代的“发电厂”，能够以数据作为“燃料”，转化成智能能力，驱动各行各业的 AI 应用，赋能各行各业。

因此，大模型被认为是下一代 AI 基础平台。

未来，可能将是 AI 大模型的时代。这几年，国内外很多企业和学术机构竞相推出自己的大模型，尤其是国产化大模型研发工作进展飞速。

今年早些时间，国内企业阿里，商汤和浪潮均发布过大模型。

这次，百度来了。

AIHub获悉，近日，鹏城实验室与百度联合召开发布会，正式发布双方共同研发的全球首个知识增强千亿大模型——鹏城-百度·文心（模型版本号：ERNIE 3.0 Titan）。

该模型参数规模达到 2600 亿，是目前全球最大中文单体模型，在 60 多项任务上取得最好效果。

同时，百度产业级知识增强大模型“文心”全景图首次亮相，从技术自主创新和加速产业应用两方面，推动中国 AI 发展更进一步。

现场，中国工程院院士、鹏城实验室主任高文，百度首席技术官、深度学习技术及应用国家工程实验室主任王海峰共同启动发布仪式。

百度发布首个知识增强千亿大模型，参数规模达2600亿

中国工程院院士、鹏城实验室主任高文（左）百度首席技术官王海峰（右）联合发布鹏城-百度·文心

高文院士在致辞中表示，“预训练模型对整个科学的发展、社会的发展、创新的发展都是非常重要的工具。运用这个工具，可以帮助做很多人工智能的赋能，不局限于某个领域，这对人工智能的发展都是一个福音。”

王海峰介绍，百度知识增强大模型从大规模知识和海量数据中融合学习，效率更高、效果更好、具有良好的可解释性。

从 2019 年 3 月发布文心 ERNIE 1.0，到最新的产业级知识增强大模型文心全景图，既包含基础通用的大模型，也包含面向重点领域、重点任务的大模型，以及丰富的工具与平台，有助于促进技术创新和产业发展。

百度发布首个知识增强千亿大模型，参数规模达2600亿

此次重磅发布的鹏城-百度·文心是“全球首个知识增强千亿大模型”，在机器阅读理解、文本分类、语义相似度计算等 60 多项任务取得最好效果，并在 30 余项小样本和零样本任务上刷新基准。

鹏城-百度·文心成功发布的背后，得益于鹏城实验室的算力系统“鹏城云脑Ⅱ”和飞桨深度学习平台的强强联手，解决了超大模型训练的多个公认技术难题，使鹏城-百度·文心训练效率大幅提升，模型效果更优。

“鹏城云脑Ⅱ”是国产自主的首个 E 级 AI 算力平台，曾在多个国际性能测试上获得冠军。

飞桨是我国首个自主研发的深度学习开源开放平台，研制了端到端自适应分布式训练框架，实现多硬件支持，并行效率高达 90%，有效支持鹏城-百度·文心千亿大模型高效、稳定地训练。

为解决大模型应用落地难题，百度团队首创大模型在线蒸馏技术，模型参数压缩率可达 99.98%。压缩版模型仅保留 0.02%参数规模就能与原有模型效果相当，为产业大规模应用打开新窗口。

为促进产学研协“多轮驱动”，鹏城实验室与百度成立了鹏城-百度自然语言处理联合实验室，并以此为依托，资源共享、优势互补，在自然语言处理前沿研究和创新应用方面协同攻关，助力打造国家战略科技力量。

本次联合发布的鹏城-百度·文心将进一步解决 AI 技术在产业应用中缺乏领域和场景化数据等关键难题。

该模型将依托鹏城云脑Ⅱ对外开放，积极联合“产学研协”各方，充分挖掘 AI 大模型的赋能能力，助力科技创新，推动产业发展。

目前，百度文心通过百度飞桨平台陆续对外开源开放，并已大规模应用于百度搜索、信息流、智能音箱等互联网产品，同时通过百度智能云赋能工业、能源、金融、通信、媒体、教育等各行各业。

在金融领域，基于百度文心实现了合同智能解析，能够在 1 分钟内完成对相关合同条款文本的解析识别，速度是之前的几十倍，大大提升了工作效率。

百度智能云的智能客服也基于百度文心提升了服务的精准性，目前已经在中国联通、浦发银行等企业应用，拓展到全国各地。

从 AI 核心技术到 AI 基础平台，从技术创新到实践落地再到开放生态，多年来，以百度为代表的中国 AI 企业坚持自主创新、开源开放，加强产学研协合作，不断降低 AI 技术开发和应用的门槛，为各行各业提供高质量发展新动能。

百度发布首个知识增强千亿大模型，参数规模达2600亿

相关教程

黄仁勋最新两万字演讲:将打破摩尔定律，发布新产品，机器人时代已经到来。 6月2日，英伟达联合创始人兼CEO黄仁勋在Computex 2024(台北国际计算机展2024)发表主题演讲，分享人工智能时代如何助推全球新工业革命。以
技术文章 06-24
生成式人工智能服务已备案信息（定期更新）促进生成式人工智能服务创新发展和规范应用，网信部门会同相关部门按照《生成式人工智能服务管理暂行办法》要求，有序开展生成式人工智能服
技术文章 05-19
钱逊发布AI数字人工服务和一站式AI智能直播综合服务水友。 8月8日，“重新定义直播活力——2023 AI创新大会”在杭州举行。作为本次大会的主办方，钱逊(杭)控股有限公司(以下简称“钱逊”)旗下的于谦
技术文章 06-24

产业资讯

游戏下载 +

近期热点 +

最新技术文章 +

06-29

以AI防火墙降低AI模型错误率，美国初创公司「Robust Intelligence」融资3000万美元据外媒 TechCrunch 报道，美国 AI 初创「Robust Intelligence」近期获 3000 万美元 B 轮融资，由 Tiger Global 领投，前股东红
06-29

商汤在美国打压之下推迟香港IPO！公告：仍坚定推进上市来自：量子位作者：明敏举国力打压中国科技公司，美国又一次得逞了。就在刚刚，商汤科技最新公告称，受美国“黑名单”及其影响，将推迟香港
06-29

微信里识别LOGO又快又准？背后有OCR模块一份功劳文章来源：微信AI导语LOGO作为公司或品牌的代表性标志，具有较强的识别和推广作用。本文将介绍微信扫一扫及长按识图中LOGO检测及识别的相关
06-29

罗振宇2022跨年演讲：数字化，原来还能这么干 2021年最后一天，罗振宇在成都举办了《时间的朋友》跨年演讲，在演进内容中，有一部分通过多个生动形象的应用案例，诠释了数字化带来的温暖
06-29

2021人工智能医疗创新TOP50 排名企业品牌备注1阿里健康线上线下相结合，数据智能形成疾病诊断、临床路径的知识图谱，实现远程就医2平安健康首创“互联网+人工智能+自