当前位置：网站首页技术文章正文

小模型挑战14倍参数大模型，谷歌探索新测试阶段扩展法则

来源：互联网发布时间：2024-09-18 20:49:53

在人工智能领域，一项由谷歌DeepMind主导的研究引发了广泛讨论，研究发现了一个令人惊讶的现象：在一个计算资源固定的前提下，小型模型在某些任务上的表现竟然超越了规模大其14倍的大型模型！

研究小组深入探讨了在大规模模型推理过程中进行计算优化的可能性。通过分析不同难度的任务，他们提出了动态调整测试时计算资源的方法。结果显示，在某些情境下，这种策略比单纯增加模型参数数量更加高效和经济。

这意味着，如果在预训练阶段节省计算资源，并在实际应用中投入更多的计算力，可能会带来更好的效果。这一结论直接挑战了传统的模型设计思路。

为了验证这一假设，研究团队采用两种主要方法来增强测试时的计算能力：一种是基于过程的密集验证器奖励模型（PRM），它能够在模型生成答案的过程中不断评分，从而指导搜索算法做出动态调整；另一种方法则是在测试阶段根据输入自适应地更新模型的响应概率分布，使模型能够逐步修正和完善其输出。

小模型挑战14倍参数大模型，谷歌探索新测试阶段扩展法则

研究进一步表明，这两种策略的有效性取决于任务本身的复杂度。基于此，研究者们提出了“计算最优”的概念，即依据任务难度自动调节测试时的计算资源分配。为了更好地理解这一点，他们将任务按照难度分为五个等级，并为每一级挑选出最优的计算策略。

研究显示，当使用较少的计算资源进行测试时，“计算最优”的扩展策略相较于传统方法具有明显的优势。特别是在PRM搜索环境下，这种策略即使在计算资源少四倍的情况下也能达到或超过传统方法的表现。

此外，研究还对比了测试时计算与增加预训练的效果。对于较为简单的问题，测试时的额外计算往往更胜一筹；而面对复杂难题，则增加预训练的计算量会更有效果。

这项研究不仅在专业领域引起了广泛关注，也在社交网络上掀起了热烈讨论。一些网友推测，这项成果可能揭示了OpenAI即将发布的新型模型“草莓”的工作原理。据称，“草莓”模型在处理用户请求时会先进行“思考”，从而提高了推理能力，而这或许正是得益于类似DeepMind研究所提出的技术。

小模型挑战14倍参数大模型，谷歌探索新测试阶段扩展法则

尽管这一切尚未得到官方证实，但可以预见的是，随着计算资源利用效率的不断提升，未来的影视作品制作流程以及观众体验都将迎来新的变革。

相关教程

[技巧] 微软调整Windows 11数字权利换机迁移政策以下是最新操作方法接网友反馈微软最近似乎已经调整Windows 11数字权利的换机迁移政策，部分机器的授权无法转移。通过虚拟机实测换机迁移步骤确实发生了变化
技术文章 08-26
[技巧][Mac] 解决微信强制使用内置浏览器打开链接问题需降级3.7.0 近期微信推出的Mac版强制使用微信内置浏览器打开内容，用户无法再通过设置选择由系统默认浏览器打开。而微信浏览器也比较垃圾功能少也无法
技术文章 08-24
国家互联网信息办公室关于发布深度合成服务算法备案信息的公告根据《互联网信息服务深度合成管理规定》，现公开发布国内深度合成服务算法备案信息，具体信息可通过互联网信息服务算法备案系统(https: b
技术文章 06-26

产业资讯

游戏下载 +

近期热点 +

最新技术文章 +

09-18

亲子游戏时间：草莓榨汁大赛，让我们一起享受制作过程的乐趣！亲子游戏时间：草莓榨汁大赛，让我们一起享受制作过程的乐趣！在忙碌的生活中，亲子时光显得尤为珍贵。今天，我们带来了一个既有趣又富有教
09-18

换个背景，视频里的人脸任你变，清华理工男把林黛玉都玩坏了｜免费体验如今，让AI视频中的任意主体保持一致已不再是难题，这一切变得触手可及。令人难以置信的是，仅凭一张图像，这一目标便能达成。正如所展示的
09-18

为什么地下偶像SANA的未增删带歌词对游戏玩家如此重要？为什么地下偶像SANA的未增删带歌词对游戏玩家如此重要？在当今的游戏文化中，音乐和偶像的影响力不容小觑。地下偶像SANA以其独特的魅力和才
09-18

斯坦福团队让机器人学会系鞋带啦，还开源了呢！就在今年初，斯坦福大学刚刚教会机器人如何烹饪佳肴，现在，他们又有了新突破——机器人学会了系鞋带！不仅如此，斯坦福还首次公开了这一技
09-18

李彦宏谈大模型：开源不等于高效，模型差距咋越来越大李彦宏内部发言引发业内广泛关注，其观点迅速成为热议焦点。近期，众多大型预训练模型频繁刷新排行榜记录，甚至在某些指标上超越了GPT-4o，