当前位置：网站首页技术文章正文

中国电信 AI 研究院完成首个全国产化万卡万参大模型训练，TeleChat2-115B 对外开源

来源：互联网发布时间：2024-10-02 22:20:53

中国电信AI研究院完成首个全国产化万卡万参大模型训练，TeleChat2_115B对外开源

9 月 28 日消息，“中国电信人工智能研究院”官方公众号宣布，中国电信人工智能研究院（下文称 TeleAI）成功完成国内首个基于全国产化万卡集群训练的万亿参数大模型，并正式对外开源首个基于全国产化万卡集群和国产深度学习框架训练的千亿参数大模型 —— 星辰语义大模型 TeleChat2-115B。

官方表示，这项科研成果标志着国产大模型训练真正实现全国产化替代，正式进入全国产自主创新、安全可控的新阶段。

TeleChat2-115B 基于中国电信自研的天翼云“息壤一体化智算服务平台”和人工智能公司“星海 AI 平台”训练完成。据介绍，其在保证训练精度的前提下利用多种优化手段提升模型训练效率和稳定性，实现了 GPU 同等算力计算效率超 93% ，模型有效训练时长占比超 98% 。

针对超大参数模型训练，TeleAI 采用了大量小模型进行 Scaling，进而验证不同模型结构的有效性。同时，在数据配比方面，基于小模型实验结果反馈，采用回归预测模型，得到较优数据配比。

在 Post-Training（后训练）方面，TeleAI 首先针对数学、代码和逻辑推理等内容合成了大量问答数据，用于 SFT（监督式微调）第一阶段模型训练。

其次，其采用迭代式更新策略，使用模型对提示词数据进行指令复杂性提升与多样性扩充，通过模型合成和人工标注提升答案质量，并利用拒绝采样获取优质 SFT 数据及 RM（奖励模型）代表性数据，用于 SFT 训练和 DPO（偏好对齐）训练，以及模型效果迭代。

附开源地址

GitHub：

https://github.com/Tele-AI/TeleChat2

Gitee：

https://gitee.com/Tele-AI/tele-chat2

ModelScope：

https://modelscope.cn/models/TeleAI/TeleChat2-115B

Modelers：

https://modelers.cn/models/TeleAI/TeleChat2-115B

相关内容：

马斯克 xAI 宣布正开源 Grok-1 模型，体量 3140 亿参数号称“全球最大”昆仑万维宣布 4 月 17 日发布并开源“天工大模型 3.0”：4000 亿参数，号称性能超 Grok 1.0AI图像生成迎来新霸主！开源模型FLUX.1横空出世，Midjourney、DALL·E 3紧张了？智谱AI 开源 CogVideoX-5B 视频生成模型，RTX 3060 显卡可运行

相关教程

Apple Watch迎来AI增强翻译功能，无需手机即可实现离线翻译在2024年苹果活动上，苹果公司宣布其watchOS将迎来多项人工智能升级。尽管许多更新早在6月的全球开发者大会（WWDC）上已经发布，但苹果在本
技术文章 09-30
华为云盘古大模型荣获深圳人工智能科技进步奖近日，经深圳人工智能奖评奖工作委员会审核通过，经过为期7天的公示，报深圳市人工智能学会理事长批准，2021年度“深圳人工智能奖”正式公
技术文章 06-28
微信/WeChat怎么只验证不绑定手机号解决聊天限制？详细教程看这里本周提到微信及微信国际版都在向未绑定号码的用户发出提醒，要求尽快验证号码否则会有功能限制。未绑定且未验证手机号码的情况下，账号将被
技术文章 08-28

产业资讯

金舟视频压缩软件快速压缩GIF动图_压缩视频后保留原画质教程

铿锵锵锵锵锵好多少破解深入分析音乐节奏的力量

OpenAI 的新 AI模型 o1-preview 和 o1-mini 在聊天机器人排名中取得最高分

游戏下载 +

冰川时代生存(内购版)

类型：游戏下载大小：209.85MB
下载
堆叠太空

类型：游戏下载大小：40.31MB
下载
踢泰迪熊(Kick The Teddy Bear)

类型：游戏下载大小：12.51MB
下载
王牌总动员

类型：游戏下载大小：267.89MB
下载
《山海旅人2》：水墨风格志怪解谜，团队冒险新篇章

类型：游戏下载大小：10M
下载

近期热点 +

最新技术文章 +

10-02

OpenAI 的新 AI模型 o1-preview 和 o1-mini 在聊天机器人排名中取得最高分科技媒体 The Decoder 发布博文，报道称在聊天机器人竞技场（Chatbot Arena）上，OpenAI 的新人工智能模型 o1-preview 和 o1-mini
10-02

Apple Intelligence测试版现已开放：文本重写工具、闪亮新 Siri 设计苹果刚刚发布了 iOS 18 1、iPadOS 18 1 和 macOS Sequoia 15 1 的公开测试版，其中包括即将推出的 Apple Intelligence 功能，如
10-02

OpenAI 50-70 亿美元融资将完成，估值有望破 1500 亿美元科技媒体 The Decoder 昨日（9 月 20 日）发布博文，报道称 OpenAI 公司即将完成一轮价值 50 亿至 70 亿美元（当前约 352 76
10-02

家庭理论电费2022最新收费标准：各类电器的电费计算方法随着科技的发展和人们生活水平的提高，家庭中电器的种类和数量不断增加，电费支出也成为家庭经济中不可忽视的一部分。了解2022年最新的家庭
10-02

突发！高通有意收购因特尔：芯片行业或迎重大洗牌据《华尔街日报》报道，高通已就收购事宜与英特尔接洽。据称交易“远未确定”，但至少就此事展开了谈判。收购英特尔将是重大新闻，也是这家