当前位置：网站首页技术文章正文

OpenAI的后来居上：GPT-4o mini发布，中国AI大模型的先行优势

来源：互联网发布时间：2024-08-04 10:23:28

此前，OpenAI 凭借 GPT-3 开拓了 AI 模型的“暴力美学”时代，同时也以训练超大参数规模的模型能力建立起 AGI 同赛道的护城河。但在其推出 GPT-4o 的“Mini”版本之后，OpenAI 似乎走向了原有优势的反方向，开始卷“小模型”，而值得注意的是：
在 Mini 这条路上，欧洲与中国的大模型团队已经率先研究了大半年。

从 2023 年上半年智谱 AI 发布对话小模型 ChatGLM-6B，10 月 Mistral 发布 7B 模型，到 2024 年 2 月面壁智能团队祭出 2.4B 的 MiniCPM，紧接着是多模态小模型 8B MiniCPM-Llama3-V 2.5，还有商汤的 1.8B SenseChat Lite、上海人工智能实验室 OpenGV Lab 团队的 Intern-VL 系列……

基于通用大模型开发小模型或端侧模型的路线，此前已在国内发酵大半年。如今，OpenAI 等世界级头部 AI 企业的入局，更表明端侧模型、“智能小模型”是大势所趋。

GPT-4o 发布后，AI 技术大牛 Andrej Karpathy 也在推特上发表了自己对“小模型”的看法：

OpenAI 终于发布 GPT-4o mini，但比中国大模型晚了半年

在 Andrej Karpathy 看来，未来将会出现参数规模小、但思考能力强的小模型；小模型才是 AI “大模型”的最终目标。

Andrej Karpathy 指出，现在的 AI 模型之所以“大”，是因为目前模型的训练仍比较粗放；换言之，即训练不高效——面壁智能团队在 3 月与 AI 科技评论的交谈中就已表达相似观点。

如何让小模型更智能？Andrej 认为关键点在于模型的知识，即训练数据。目前来看，无论是 OpenAI、还是面壁智能等团队，他们的路线都是先将模型“做大”、然后再将模型“做小”，原因在 Andrej 看来，是因为“小模型需要依托大模型来重构理想的合成数据”，直到大模型中的高质量数据被耗尽。

除数据考虑外，面壁团队还告诉 AI 科技评论，从 2023 年下半年开始，他们通过建立一套“用大模型训练小模型”的沙盒实验机制，是为了验证他们所理解的“Scaling Law”，即模型参数规模随着时间推移递减、但智能水平不断上升的“面壁定律”——大模型的智能密度每 8 个月翻一倍。

如果模型能在越小的规模上实现更高的智能，那么模型的训练与推理成本都将大幅下降。但据 AI 科技评论了解，该方向对算法与数据工程的挑战也十分巨大，中间的技术门槛并不低。

随着成本下降，英伟达的 GPU 需求量也将受到影响。有业内人士向 AI 科技评论评价，“对英伟达来说，相比 GPT-4o 或 GPT-4o mini，年底的 GPT-5 才是一个关键节点。”

同时，从商业上来看，GPT-4o mini 作为一个性价比极高的云端模型，对国内外云端 API 市场也将造成冲击，大规模的云端模型更难赚钱；相反，端侧模型将成为新的市场“显学”。

GPT-4o mini 能力揭秘

作为 GPT-4o 更小参数的简化版本，此次 GPT-4o mini 的发布意味着 OpenAI 正式“进军”多模态小模型。据官网介绍，目前，在API层面，GPT-4o mini支持128k、16k输入tokens（图像和文本），未来还将支持视频和音频的输入和输出。

但是，OpenAI 并未透露此次新模型的参数量大小。

数据显示，GPT-4o mini 在文本智能和多模态推理方面的学术基准测试中超越了 GPT-3.5 Turbo 和其他小模型，并且支持的语言范围与 GPT-4o 相同。此外， GPT-3.5 Turbo 相比，其长上下文性能也有所提高。

与 GPT-4 相比，GPT-4o mini 在聊天偏好上表现优于 GPT-4 ，并在大规模多任务语言理解（MMLU）测试中获得了82%的得分。公开资料介绍，MMLU 是一项包含 57 个学科大约 16000 道多项选择题的考试，得分越高的大模型在各种领域中理解和使用语言的能力越强。

从 OpenAI 提供的数据来看，GPT-4o mini 的得分为82%，Google 的 Gemini Flash得分为77.9%，Anthropic 的Claude Haiku 得分为73.8%，GPT-4o mini 能力更强：

OpenAI 终于发布 GPT-4o mini，但比中国大模型晚了半年

在实现性能优化的同时，价格也更便宜。

OpenAI 表示，GPT-4o mini 的成本为每百万输入标记（token）15 美分，每百万输出标记 60 美分，比 GPT-3.5 Turbo 便宜超过 60%。即日起正式向免费版、Plus 版和团队版的 ChatGPT 用户开放，企业用户则从下周开始可使用。

OpenAI 终于发布 GPT-4o mini，但比中国大模型晚了半年

OpenAI 也想在小模型市场“分一杯羹”。

此前，无法承担 OpenAI 模型昂贵费用的开发者往往会选择更便宜的替代，如 Gemini 1.5 Flash 及 Claude 3 Haiku，这或许也是此次 OpenAI 推出小模型的主要原因——为开发者提供更为轻量且廉价的工具，以创建其无法负担的大模型（如 GPT-4）的应用程序和工具。

对于此次 GPT-4o mini 的推出，社交平台上外国网友们似乎存在不少不买账的声音，部分网友催促 OpenAI 发布 GPT-4o 完整版，「No one wants a cheaper 3.5. We want a better 4o.」（没有人想要更便宜的3.5，我们想要更好的4o），还有网友显然对于 GPT-4.5 以及 GPT-5 的热情更盛。

OpenAI 终于发布 GPT-4o mini，但比中国大模型晚了半年

但也有国产大模型团队指出，GPT-4o mini 是相对 GPT-4o 的“Mini”版本，具体参数量不详，因此如商汤、面壁智能、上海人工智能实验室等团队难以与其比拼。

OpenAI 退出中国市场后，对国内模型团队的影响有限。一位端侧模型从业者告诉 AI 科技评论，OpenAI 在 Mini 模型上的这一举动，或许是为了响应硅谷智能硬件兴起的浪潮，同时对苹果 AI 在端侧能力上的需求作出反应。

从今年上半年开始，苹果 AI 团队相继发布其在手机端侧上运用的 AI 成果，如 Ferret-UI、OpenELM、MM1 等等，对模型落到端侧起了开头。相当于，苹果已经在手机 AI 端出了开卷考试，接下来各家模型厂商与手机厂商都要思考如何答题。

国产小模型不输 OpenAI

而根据以往成果发布，国产大模型团队在文本小模型、乃至多模态小模型上的能力也表现卓然：

今年 4 月，商汤发布了1.8B（18亿）参数规模的 SenseChat-Lite版本，作为端侧模型，交互体验对标GPT-4，当时性能已实现同等尺度性能最优。

后来，在 WAIC 期间，商汤又再次进行端侧模型的更新，较 4 月推出的版本首包耗时降低 40%，速度更快。

上海人工智能实验室 OpenGV Lab 的 InternVL 也是中国多模态小模型的系列典范。从 InternVL-Chat-V1.5 到书生万象 Intern VL 2.0，OpenGV Lab 团队开源了从多模态模型系列，参数规模从 1B 到 76B 不等，其中小模型最高 8B、最小 1B，均可单卡部署。据 AI 科技评论了解，其 1B 版本的参数规模实际只有 938 M。

值得注意的是，OpenGV Lab InternVL 系列的 26B 自开源以来一直是 Hugging Face 上的当红炸子鸡，以开源不过两周的 InternVL 2.0 为例，其 26B 在 Hugging Face 上的下载量已超过 6000 次。

OpenAI 终于发布 GPT-4o mini，但比中国大模型晚了半年

同样在 Mini 模型上发力的国产代表团队还有面壁智能。他们在小模型上的成果包含基座模型与多模态模型，在 Hugging Face 上的下载量已经近 95 万次，Github 上获得超过 1 万星标，这一端侧模型系列不仅是开源社区口碑之作，甚至一度火到全网热搜第一。

相关教程

视频重绘工具DomoAI 不用SD视频一键就能转动漫 DomoAI是一款AI艺术生成器，用户可以通过简单的操作，充分发挥他们的创造力，产生高质量、具有风格的视觉效果。不仅如此，DomoAI提供多种预
技术文章 05-17
微软新必应搜索初步体验总结大家好，这里是AIHub，我会继续和大家分享人工智能相关的新鲜知识。2月8日，微软在自己的Edge浏览器中正式发布了新的Bing，它结合了ChatGPT
技术文章 06-28
韩国AI公司Neosapience获得2150万美元B轮融资，专注于AI语音视频合成 AIHub 获悉，韩国语音和视频合成初创公司Neosapience近日宣布获得 2150 万美元的 B 轮融资，以加速业务发展和扩大市场规模，尤其是进
技术文章 06-29

产业资讯

buckshot roulette结局大全 buckshot roulette全结局达成一览[多图]

游戏下载 +

超级卡车司机手游

类型：游戏下载大小：72.24M
下载
生存猎人手游

类型：游戏下载大小：146.59M
下载
黑创世纪重启手游

类型：游戏下载大小：188.00M
下载
宝宝当医生手机版

类型：游戏下载大小：22.95M
下载
宝宝森林快递员手游

类型：游戏下载大小：20.38M
下载

近期热点 +

最新技术文章 +

08-02

微软AI大户：TikTok如何利用人工智能技术革新内容推荐在全球云计算市场的竞争中，微软通过整合OpenAI的人工智能技术，成功地将其云服务转化为一项利润丰厚的业务。以TikTok为例，据一位接触过内
08-02

萝卜快跑：国内robotaxi领域的创新者与领航者 7月初，百度萝卜快跑在武汉商业化落地，正式开启无人驾驶出租车的热潮。除了无人驾驶出租在商业化上快速推进，政策上也不断迎来利好。8月1
08-02

本土化AI搜索：快手可灵如何定义中国版Sora 快手可灵是快手于2024年6月6日推出的一款AI视频生成大模型的AI视频。可灵为快手AI团队自研，基于快手在视频技术方面的多年积累，采用类似
08-02

阿里国际进军AI搜索：全球市场的新动向 AI搜索赛道越来越拥挤，几乎有搜索框的地方就有AI搜索战火。将AI驱动作为核心战略的阿里国际，自然也不会缺席这场赛事。据华尔街见闻了解，
08-02

海外市场观察：Sora如何面临可灵的激烈竞争在开放公测后，一众业内人士和吃瓜群众迅速涌入，在快手旗下创作工具快影 App申请，一试可灵到底灵不灵。而汇集多项测评及反馈，可以看到