当前位置: 网站首页 技术文章 正文

三大模型联手挑战O1,实战360多个模型合作搞定提示词工程

来源:互联网 发布时间:2024-09-25 01:16:59

随着OpenAI的o1模型震撼登场,它不仅标志着大型人工智能模型的新篇章,也开启了一个新的范式——推理定律(Inference Law)。正如英伟达的人工智能科学家Jim Fan所言,o1的诞生意味着业界开始将更多精力从训练阶段转向了推理过程。Jim引用了机器学习先驱Rich Sutton在其经典文章《苦涩的教训》中的观点,强调了只有学习和搜索两种技术能够无限扩展人工智能的潜力。而今,正是时候更加关注后者。

三大模型联手挑战O1,实战360多个模型合作搞定提示词工程

增加对推理侧的投资,可以使模型拥有更全面的思考流程,这样的投入带来了质量上的飞跃。在国内,360公司的创始人周鸿祎与这一理念不谋而合,并且早前就提出了“慢思考”的概念,在技术和产品上进行了实践。此外,360还倡导多模态合作,集合不同厂商的大模型力量,共同推动国内大模型的发展,使之能够迎头赶上OpenAI的步伐。

尽管o1的具体运作细节仍然是个谜,但可以确定的是,思维链(Chain of Thought, CoT)在其中起到了关键作用。OpenAI表示,通过思维链,模型能够学会识别并修正错误,分解复杂任务为简单步骤,甚至尝试多种方法来解决问题,从而大大增强了其推理能力。今年的国际学习表征会议(ICLR)上,一篇由谷歌大脑推理团队创建者Denny Zhou等多位专家撰写的论文揭示了思维链的巨大潜力。

从根本上讲,思维链体现了诺贝尔经济学奖得主卡尼曼在《思考快与慢》中提出的“系统2”,即复杂的、有意识的推理过程。与之相对应的是“系统1”,即直观快速的直觉反应。o1的成功证明了这种人类特有的“慢思考”同样适用于大模型。值得注意的是,这两种思维方式在人脑中是相辅相成的,在构建大模型时也不应该将其割裂开来。周鸿祎推测,o1可能遵循着双系统理论,即快速与慢速思考系统的协作。

三大模型联手挑战O1,实战360多个模型合作搞定提示词工程

作为“百模大战”的参与者之一,周鸿祎和他的团队正在积极推动“慢思考”以及多系统协同的理念。在今年7月底举行的ISC.AI大会上,他宣布要打造一个增强大模型慢思考能力的系统。基于这一机制,360已经开发出两款明星产品:360AI搜索和360AI浏览器,它们通过多个模型的合作实现了从快速到慢速思考的转变。

360AI搜索提供了简洁回答、标准回答和深入回答三种模式,一次深入回答可能涉及多次调用不同的大模型。例如,它可能会调用意图识别模型、搜索词改写模型、网页排序模型等。通过这样的多模型协同工作,360AI搜索能更有效地处理用户查询。而在360AI浏览器中,更是集成了来自16家厂商的54款大模型,赋予了传统浏览器无法比拟的功能,如快速总结学术论文、沉浸式文档翻译以及在线视频内容分析等。

360的做法不仅仅是改善用户体验,也是激励各大模型开发者的一种方式。由于大模型的研发成本高昂,需要庞大的用户基数才能实现投资回报。360通过开放其平台给大模型开发者,帮助他们触达数以亿计的用户。因此,这不仅是360与众多厂商之间的双赢局面,也为国产大模型提供了一个展示实力的竞争平台。

从技术层面来看,360推出的CoE架构连接了更多的大模型和专业模型,通过思维链和多系统协同的方式,使得快速与慢速思考得以有机结合。CoE架构不仅包括了OpenAI自家模型,还吸纳了更多第三方模型,形成了一种更加智能化且高效的系统。这种架构的优势在于它可以在保证高质量输出的同时减少资源消耗,提高响应速度。而且,CoE架构对于所有模型都是开放的,比OpenAI走得更远。

三大模型联手挑战O1,实战360多个模型合作搞定提示词工程

无论是o1还是CoE架构,都预示着一个新趋势:简化人工操作,特别是在大模型应用中“消灭”提示工程。虽然提示词的质量直接影响生成内容的好坏,但未来的目标是让大模型自动完成这项任务,使普通用户无需再为此烦恼。这反映了360对未来AI发展的愿景:让大模型更加普及,成为日常生活的一部分。

相关教程