当前位置: 网站首页 技术文章 正文

小米AI模型MiLM-6B首次曝光:64亿参数,整体C-Eval榜单第10名。

来源:互联网 发布时间:2024-06-24 14:31:50

8月11日消息,小米公司之前并没有正式加入AI大模型赛道,但小米的AI大模型MiLM-6B已经悄然出现在C-Eval和CMMLU大模型评测榜单中。截至目前,小米大机型在C-Eval总榜排名第10,同参数顺序排名第1。

根据项目页面给出的信息,IT之家知道MiLM-6B是小米公司开发的大规模预训练语言模型,参数规模64亿。

小米AI大模型MiLM_6B首次曝光:64亿参数,C_Eval总榜排名第10
▲从MiLM-6B的GitHub页面和C-Eval给出的信息来看,MiLM-6B模型在具体科目的得分上取得了很高的准确率,在STEM(科学、技术、工程和数学教育)的全部20个科目中,计量、物理、化学、生物等多个项目都取得了很高的准确率。

小米AI大模型MiLM_6B首次曝光:64亿参数,C_Eval总榜排名第10
▲来源C-Eval据悉,MiLM-6B模型在大部分文科科目中表现出了相对较好的准确性,但在“法律、数学、编程、概率论、离散数学”等涉及“抽象思维”的科目中仍有一定的进步。

在10个“社会科学”测试科目中,除了“教育和地理”之外,模型在其他8个科目中都取得了理想的准确率。在人文学科的11个科目中,MiLM-6B在“历史与法律”的基础上有着不错的准确率表现。

大AI模型MiLM-6B首次曝光,但完成度很高。未来这种模式可能会用在小米的“小爱同学”等虚拟助理服务中。

相关教程