当前位置: 网站首页 技术文章 正文

阿里云拥有最强的中英文70亿参数开源模型,依桐钱文7B模型上线。

来源:互联网 发布时间:2024-06-24 21:40:50

8月3日,两款开源模型Qwen-7B和Qwen-7B-Chat在AI模型社区ModelScope上架。阿里云确认它们是通用模型和对话模型,有70亿个参数,两个模型都是开源、免费、商用的。在多项权威评测中,依桐钱文7B机型取得了远超国内外同尺寸机型的成绩,成为业界最强中英文7B开源机型。

今年4月,阿里云推出自研大机型依桐钱文,引发市场需求井喷。小型化模型版本开源,有望平滑模型使用门槛,让大量中小企业和AI开发者更早更快使用依桐钱文。此举也让阿里云成为国内首家加入大模型开源行列的大型科技企业。

Qwen-7B是支持中文、英文和其他语言的基本模型。在超过2万亿的token数据集上进行训练,上下文窗口长度达到8k。Qwen-7B-Chat是一个基于基座模型的中英对话模型,已经与人类认知对齐。开源代码支持量化Qwen-7B和Qwen-7B-Chat,支持用户在消费级显卡上部署和运行模型。

用户可以直接从Magic Ride社区下载模型,或者通过阿里云纪灵平台访问和调用Qwen-7B和Qwen-7B-Chat。阿里云为用户提供包括模型训练、推理、部署、微调在内的全方位服务。

阿里云开源最强中英文70亿参数模型,通义千问7B模型上线魔搭
依桐钱文7B的预训模型在多项权威基准测试中表现出色,中英文能力远超国内外同规模开源模型,部分能力甚至“跨越”赶超12B、13B开源模型。

在英语能力评测基准MMLU上,依桐钱文7B模型的得分高于其他主流开源模型7B、12B和13B。基准包含57个英语科目,测试人文、社会科学、理工科等领域的综合知识和解题能力。

在基准C-eval上,依桐钱文是验证集和测试集得分最高的7B开源模型,显示了扎实的中国能力。相比英语世界热闹的AI开源生态,华人社区缺少一个优秀的基座模型。依桐钱文的加入,有望为开源社区提供更多选择,推动中国AI开源生态建设。

阿里云开源最强中英文70亿参数模型,通义千问7B模型上线魔搭
依桐钱文7B模型在GSM8K和Humaneval的基准测试上也表现不错,优于所有同规模的开源模型和一些大规模的开源模型。

阿里云表示,开源的大模型可以帮助用户简化模型训练和部署的过程。用户不必从零开始训练模型,只需下载预先训练好的模型并进行微调,就能快速构建出高质量的模型。

开源生态对于推动中国大模型的技术进步和应用非常重要。今年7月,阿里云宣布以促进中国大模型生态的繁荣为首要目标,向大模型创业公司提供智能计算能力、开发工具等全方位服务。2022年,阿里云率先推出AI模型社区magic,以AI模型为核心服务AI开发者。目前,魔骑已经聚集了20多家顶级人工智能机构贡献的1000多个开源模型,成为国内第一大模型开源门户。

附:开放源地址

神奇模型示波器:

相关教程