当前位置：网站首页技术文章正文

王小川百川智能发布了拥有130亿参数的百川-13B模型，该模型开源并可商用。

来源：互联网发布时间：2024-06-25 17:52:03

继百川-7B之后，王小川旗下的百川智能近日再次发布了百川-13B的大模型。

据介绍，百川-13B是百川智能继百川-7B之后研发的开源、可商用的130亿参数大规模语言模型，在权威的中英文基准测试中取得了同规模的最好成绩。本次发布包括两个版本:预训练(百川-13 b-基础)和对齐(百川-13 b-聊天)。

百川-13B具有以下特点:

更大尺寸、更多数据:Baichuan-13B 在 Baichuan-7B 的基础上进一步扩大参数量到130亿，并且在高质量的语料上训练了1.4万亿 tokens，超过 LLaMA-13B40%，是当前开源13B 尺寸下训练数据量最多的模型。支持中英双语，使用 ALiBi 位置编码，上下文窗口长度为4096。同时开源预训练和对齐模型:预训练模型是适用开发者的『基座』，而广大普通用户对有对话功能的对齐模型具有更强的需求。因此本次开源我们同时发布了对齐模型（Baichuan-13B-Chat），具有很强的对话能力，开箱即用，几行代码即可简单的部署。更高效的推理:为了支持更广大用户的使用，我们本次同时开源了 int8和 int4的量化版本，相对非量化版本在几乎没有效果损失的情况下大大降低了部署的机器资源门槛，可以部署在如 Nvidia3090这样的消费级显卡上。开源免费可商用:Baichuan-13B 不仅对学术研究完全开放，开发者也仅需邮件申请并获得官方商用许可后，即可以免费商用。

【拥抱脸】

预培训模型:

相关教程

悼念！商汤创始人汤晓鸥逝世，享年55岁据多方消息证实，商汤科技创始人、香港中文大学教授汤晓鸥，在睡梦中不幸离世，享年55岁。有商汤人士称：你真的不知道明天先来还是无常先来
技术文章 05-21
稳定AI:稳定扩散3介质模型正式开源。 6月3日晚，知名开源模型平台Stability AI联席CEO Christian la forte在AMD的产品发布会上宣布，文生图模型。
技术文章 06-24
利用生成式人工智能提高蛋白质设计的效率，荷兰生物技术公司Cradle获得了2400万美元的首轮融资。近日，据海外媒体报道，来自荷兰的生物技术公司据报道，Cradle利用生成式人工智能技术帮助科学家设计蛋白质。通过开发易于使用的基于网络的
技术文章 06-23

产业资讯

游戏下载 +

吴双西游手游正版官方

类型：游戏下载大小：1426.71M
下载
我是卧底app

类型：游戏下载大小：174.56M
下载
婴儿森林食品完整版

类型：游戏下载大小：86.32M
下载
放置最新版的冒险骑士

类型：游戏下载大小：116.20M
下载
购买最新版本的猫

类型：游戏下载大小：82.73M
下载

近期热点 +

最新技术文章 +

06-25

官方公告！马斯克创立了人工智能公司xAI，目标是了解“宇宙的真正本质” 来源:国家商报。当地时间周三，马斯克领导的团队宣布成立xAI人工智能公司。公司官网:图片来源:Twitter截图xAI表示，公司的目标是了解宇宙的
06-25

Shopify推出了新的人工智能助手Sidekick，帮助企业回答问题。 Shopify最近推出了一款名为“Sidekick”的新AI聊天机器人助手，帮助商家回答问题。Sidekick可以为商家完成任务，节省时间，回答店铺销售趋
06-25

生成式人工智能服务管理暂行办法国家互联网信息办公室国家发展和改革委员会中华人民共和国教育部中华人民共和国科学技术部工业和信息化部中华人民共和国公安部国家广播电视
06-25

与ChatGPT竞争:谷歌聊天机器人Bard向欧洲和巴西扩张。北京时间7月14日早间消息，据报道，当地时间周四，谷歌表示将在欧洲和巴西推出人工智能聊天机器人Bard，这是该公司自今年2月推出该产品以来
06-25

微软联手Meta，Llama 2成为AI领域新焦点。在最近的Inspire大会上，微软和Meta两大科技巨头宣布了一项重大合作:在Azure和Windows平台上支持Llama 2大型语言模型。此次合作不仅标志着