警告!尝试探讨最新o1模型的内部思考过程可能会导致您的账户面临风险。
根据用户的反馈,在o1模型发布不久后,许多人收到了来自OpenAI的警告邮件,提醒他们不要试图获取模型的思考轨迹,否则可能面临账户被暂停的风险。
一些用户提到,即使不直接使用某些关键词,而是采取其他方式引导模型展示其思考过程,也会被系统检测到并收到警告。
有报道称,有些用户因违规操作被暂时禁用账户长达一周。
这些用户的目的在于让o1模型揭示其完整的思考路径,即所谓的原始思考令牌。
然而,目前用户只能通过ChatGPT界面查看到模型思考过程的摘要,而非完整的思考流程。
事实上,OpenAI在发布o1时已经解释了为何不提供完整思考过程的原因,即为了保护模型的安全性和稳定性。
尽管如此,这一决定并未得到所有人的认同。有人认为,o1的思考过程可能成为其他模型训练的宝贵资源,因此OpenAI不愿这些数据外流。
另一些观点则认为,这表明o1并没有显著的技术壁垒,一旦其思考过程被揭示,便容易被复制。
此外,也有批评认为这是在鼓励用户盲目信任AI而不寻求解释。
关于o1的技术细节,OpenAI透露的信息并不多,仅仅提到了使用了强化学习技术。
现在可以确认的是,o1即是之前被广泛讨论的“草莓”,一种新的方法论。
然而,它是否可以被称为GPT-5,或是仅仅是GPT-4的升级版,仍有争议。
有传言称,OpenAI内部称o1为“带有推理能力的4o”。尽管这一说法尚未得到证实,但有内部人士点赞了相关爆料。
在OpenAI举办的问答活动中,对于这些质疑,官方并未给出直接回应。
同时,OpenAI的CEO萨姆·奥特曼暗示,“草莓”阶段已结束,接下来将推出名为“猎户座”(Orion)的新模型。
围绕o1的另一个争议点是其是否符合科学规范,比如没有引用先前的研究成果,也没有与其他模型进行对比测试。
随着API的开放,第三方机构已经开始对其性能进行评估。在几项基准测试中,o1的表现参差不齐,虽然在某些方面超越了旧版本,但在代码编写任务上却不如竞争对手。
尽管如此,一些团队报告称,在特定任务上,如问题诊断,o1展示了更好的表现。
值得注意的是,o1的成本较高,每一百万输出token需支付60美元,且隐藏的思考令牌也被计入其中。
在OpenAI举办的问答活动中,官方解释了o1命名背后的含义,以及不同版本之间的区别。
OpenAI强调,o1是一个从头训练的模型,具备生成思考链的能力,而非简单的模型叠加。
此外,官方也确认了o1具备处理更长文本的能力,并且正在研究更多功能,如工具调用和多模态能力等。
关于价格问题,OpenAI承诺未来将遵循降价趋势,并放宽使用限制。
如果您对o1有任何疑问或见解,不妨在下方留言讨论。