当前位置：网站首页技术文章正文

陶哲轩提前试用满血版o1：能当研究生用

来源：互联网发布时间：2024-09-17 08:36:14

让人羡慕不已的是，陶哲轩早在今年8月便已体验到了OpenAI的o1模型，而且还是那个众人期盼已久的满血版本。他带着一些模糊措辞的数学问题向o1发起了挑战，结果发现o1不仅能准确识别出克莱姆定理，还能给出令人满意的解答。

陶哲轩提前试用满血版o1：能当研究生用

陶哲轩不仅停留在初次体验上，他还进一步进行了多项测试，包括对比了o1与之前的模型，如ChatGPT和GPT-4，在处理数学问题上的表现差异。尽管新模型在处理某些复杂问题时依然会犯错，未能展现出独立思考的能力，但其表现明显优于先前的版本。

在一系列的测试中，陶哲轩首先重复了此前对ChatGPT的测试，询问了一个涉及克莱姆法则的问题。与以往不同的是，o1不仅条理清晰地回答了问题，还准确找到了克莱姆定理，并给出了令人满意的答案。

接下来的测试中，他提出了一个复杂分析课程中的问题，以及要求将质数定理转换为Lean定理的任务。虽然o1在后者的解答中出现了一些小错误，但整体而言，模型展现了对任务的良好理解和合理的初步分解。

陶哲轩提前试用满血版o1：能当研究生用

陶哲轩认为，如果对模型进行针对性的微调，并整合进IDE中，那么在公式化项目方面将变得更为实用。同时，他也提到，在日常研究工作中，使用大模型如GPT 4o等，已经成为一种常态，特别是在运筹学领域，这些模型可以提供有价值的MIP公式。

尽管如此，陶哲轩也指出了使用大模型的一些局限性，强调了有效使用提示的重要性。而对于那些觉得大模型不够好用的用户，他认为可能是因为没有充分利用其潜力，或是期望过高。

面对外界对其评价的争议，陶哲轩解释说，他所提到的大模型相当于“平庸但不完全不称职的研究生”的说法，更多是一种形象的比喻，而非实际的等价关系。他认为，随着技术的进步，大模型将在数学研究中发挥更大的作用。

陶哲轩提前试用满血版o1：能当研究生用

最后，不少用户也分享了自己的心得，认为虽然难以精确衡量使用大模型节省了多少时间，但随着个人提示词工程技能的提升，可以更高效地利用这些工具。

相关教程

谷歌AI聊天机器人 Bard 新增Gmail等谷歌应用插件谷歌的AI聊天机器人Bard最近获得了更新，增加了对Gmail、Docs和Drive等谷歌应用的插件支持。更新后的谷歌Bard支持的应用插件可以实时获取来
技术文章 07-01
微软必应AI聊天机器人现在支持图片搜索。 7月19日消息，微软周二宣布对其人工智能聊天机器人进行了重大更新，增加了图片搜索功能。用户现在可以拍摄照片或上传到Bing chat，并通过
技术文章 06-25
亚马逊的全面AI:所有亚马逊业务都有AI项目。亚马逊首席执行官安迪·贾西(Andy Jassy)周四在该公司2023年第二季度财报会议上表示，亚马逊的“每项业务”都“目前正在执行多项生成式人
技术文章 06-24

产业资讯

游戏下载 +

近期热点 +

最新技术文章 +

09-17

蜜桃草莓荔枝375ML游戏评测：最甜蜜的角色扮演冒险！蜜桃草莓荔枝375ML游戏评测：最甜蜜的角色扮演冒险！在这个充满色彩和甜蜜气息的游戏中，玩家将扮演一位勇敢的探险者，踏上一段寻找神秘果
09-17

DNF爱心玫瑰武器装扮：轻松获得方法与步骤 DNF爱心玫瑰武器装扮：轻松获得方法与步骤在DNF（Dungeon & Fighter）这款广受欢迎的游戏中，武器装扮不仅能够提升角色的外观，还能增加
09-17

小洞想吃香肠喝牛奶：儿童益智游戏角色的饮食习惯小洞想吃香肠喝牛奶：儿童益智游戏角色的饮食习惯在儿童益智游戏的世界中，角色的饮食习惯往往被设计得既有趣又富有教育意义。今天，我们来
09-17

北大校友用AI打造「我的世界」版模拟社会，1000个Agent圈地大作战由北大校友所创造的1000个智能体在《我的世界》中构建了一个充满活力的虚拟社会，吸引了众多关注者。任何一条关于该项目的更新都会吸引数十
09-17

cheaperapp.work 浏览器.net：探索游戏世界的无限可能在当今竞争激烈的网络环境中，游戏网站要想脱颖而出，关键词优化成为了不可或缺的一环。本文将为您揭示如何通过关键词策略，提升您的游戏网