当前位置：网站首页技术文章正文

元象发布中国最大 MoE 开源大模型：总参数 255B，激活参数 36B

来源：互联网发布时间：2024-09-28 16:16:30

元象 XVERSE 发布中国最大 MoE 开源模型 XVERSE-MoE-A36B。

该模型总参数 255B，激活参数 36B，官方号称效果能“大致达到”超过 100B 大模型的“跨级”性能跃升，同时训练时间减少 30%，推理性能提升 100%，使每 token 成本大幅下降。

MoE（Mixture of Experts）混合专家模型架构，将多个细分领域的专家模型组合成一个超级模型，在扩大模型规模的同时，保持模型性能最大化，甚至还能降低训练和推理的计算成本。谷歌 Gemini-1.5、OpenAI 的 GPT-4 、马斯克旗下 xAI 公司的 Grok 等大模型都使用了 MoE。

在多个评测中，元象 MoE 超过多个同类模型，包括国内千亿 MoE 模型 Skywork-MoE、传统 MoE 霸主 Mixtral-8x22B 以及 3140 亿参数的 MoE 开源模型 Grok-1-A86B 等。

元象发布中国最大MoE开源大模型：总参数255B，激活参数36B

附相关链接：

Hugging Face：https://huggingface.co/xverse/XVERSE-MoE-A36B魔搭：https://modelscope.cn/models/xverse/XVERSE-MoE-A36BGithub：https://github.com/xverse-ai/XVERSE-MoE-A36B

相关内容：

李开复旗下 AI 公司零一万物宣布开源 Yi-9B 模型，号称同系列代码、数学能力最强Meta即将推出新一代Llama3大语言模型全球首个芯片设计开源大模型SemiKong正式发布性能超越通用大模型超越Llama 3的性能怪兽：Falcon 2开源大模型，商用AI的新标杆

相关教程

[教程] 微软推出脚本帮助主播自动解决WinRE问题无需再手动使用命令行扩容本周微软向Windows 10 11发布更新修复各类已知问题，其中也包括BitLocker硬盘加密锁可能被绕过问题。然而这个问题牵涉到WinRE恢复分区，而
技术文章 08-22
夸克发布AI搜索，提供智能回答、创作和总结能力 AIHub最新消息，夸克近日升级“超级搜索框”，推出以AI搜索为中心的一站式AI服务，为用户提供从检索、创作、总结，到编辑、存储、分享的一
技术文章 07-13
[技巧] 微软为Windows 11带来加密DNS自动查找功能(DNR) 以下是开启方法网络指定解析器发现(DNR)是即将推出的IETF标准，该标准主要功能是用于自动发现提供加密的DNS服务器。在有DNR前从本地网络获取 DNS 服务器
技术文章 08-23

产业资讯

WPS Word文档中隐藏文字内容的方法_使用wps拆分合并的Excel单元格

沙利文：商汤小浣熊，在中国上百亿的AI代码市场里最能打！

揭秘：古代帝王游戏中的爱情与占有

游戏下载 +

芭蕾舞女演员漂亮女孩(Ballerina Pretty Girl Dress up)

类型：游戏下载大小：34.69MB
下载
坏女孩摔跤(Bad Girls Wrestling)

类型：游戏下载大小：148.08MB
下载
迷你小世界

类型：游戏下载大小：306.78MB
下载
植物大战僵尸幼儿园版手机版

类型：游戏下载大小：312.12MB
下载
次元少女爱美妆

类型：游戏下载大小：107.72MB
下载

近期热点 +

最新技术文章 +

09-28

沙利文：商汤小浣熊，在中国上百亿的AI代码市场里最能打！近期，知名市场研究机构Frost & Sullivan联手头豹研究院共同发布了《中国AI代码生成市场研究报告》。此报告在深入调研与严格筛选后，确认
09-28

Meta 承认使用澳大利亚 Facebook、Instagram 成年码友发布的公开内容训练AI模型据澳大利亚 ABC 新闻报道，Meta 公司承认在平台上收集了所有澳大利亚成年人的公共数据。但与在欧盟国家的做法不同，由于澳大利亚没有出
09-28

Llama系列出新品啦！3.2版开源比闭源强，还跟Arm合作推手机优化版多模态领域迎来重大突破，开源模型正超越闭源对手！近日，在Meta举办的开发者大会上，Llama 3 2以全新的面貌亮相：该版本不仅具备了处理多
09-28

做I爱直播APP：虚拟与现实的交织：直播中的人际互动分析在数字化时代，直播技术以其即时性和互动性，成为连接人与人的新型纽带。做I爱直播APP作为这一趋势的产物，不仅改变了人们获取信息和娱乐的
09-28

阿里通义将发布AI视频生成大模型，支持文生视频、图生视频阿里通义将在 2024 云栖大会（9 月 19 日至 9 月 21 日）期间发布视频生成大模型，目前通义App 频道和通义万相 PC 端已上线“