当前位置：网站首页技术文章正文

OpenAI 的新 AI模型 o1-preview 和 o1-mini 在聊天机器人排名中取得最高分

来源：互联网发布时间：2024-10-02 21:50:33

科技媒体 The Decoder 发布博文，报道称在聊天机器人竞技场（Chatbot Arena）上，OpenAI 的新人工智能模型 o1-preview 和 o1-mini 问鼎榜首。

聊天机器人竞技场简介

聊天机器人竞技场是一个比较人工智能模型的平台，它利用 6000 多个社区评分对新的 OpenAI 系统进行了评估。

结果

结果显示，o1-preview 和 o1-mini 尤其在数学任务、复杂提示和编程方面表现出色。

OpenAI的新AI模型o1_preview和o1_mini在聊天机器人排名中取得最高分

Lmsys 提供的数学模型优势图表清楚地显示，o1-preview 和 o1-mini 的得分超过 1360 分，远高于其他模型的表现。

O1 的目标是为人工智能推理设定一个通用新标准，即在回答前“思考”" 更长时间。

然而，O1 模型并非在所有方面都优于 GPT-4o。许多任务并不需要复杂的逻辑推理，有时 GPT-4o 的反应更快。

注意事项

o1-preview 和 o1-mini 的票数远低于 GPT-4o 或 Anthropic's Claude 3.5 等成熟模型，每个模型都只有不到 3000 条评论，这样小的样本量可能无法准确代表实际结果，限制结果的意义。

相关内容：

OpenAI回应“ChatGPT发疯”问题：token预测是根源OpenAI宣布与Figure合作将GPT整合到机器人对标GPT-4 Turbo！OpenAI断供后科大讯飞星火API调用量大增OpenAI CEO承认“GPT-4O MINI”字母数字组合的命名方式存在问题

相关教程

前小米机器人骨干创业公司“灵足时代”完成数千万元天使轮融资具身智能核心部件公司“灵足时代 Robstride Dynamics”9 月 13 日宣布完成数千万元天使轮融资。本轮融资由雅瑞智友科学家基金、英诺天
技术文章 09-28
cheaperapp.work 浏览器.net：探索游戏世界的无限可能在当今竞争激烈的网络环境中，游戏网站要想脱颖而出，关键词优化成为了不可或缺的一环。本文将为您揭示如何通过关键词策略，提升您的游戏网
技术文章 09-17
元宵猜灯谜：MD换母×苏秦带来不一样的元宵节体验元宵猜灯谜：MD换母×苏秦带来不一样的元宵节体验元宵节，又称上元节、小正月、元夕或灯节，是中国汉族和一些少数民族的传统节日之一
技术文章 09-15

产业资讯

弈仙牌残局代码答案大全最新所有残局代码答案一览

古龙风云录第二章新增支线攻略第二章彩蛋通关图文一览

Apple Intelligence测试版现已开放：文本重写工具、闪亮新 Siri 设计

游戏下载 +

冰川时代生存(内购版)

类型：游戏下载大小：209.85MB
下载
堆叠太空

类型：游戏下载大小：40.31MB
下载
踢泰迪熊(Kick The Teddy Bear)

类型：游戏下载大小：12.51MB
下载
王牌总动员

类型：游戏下载大小：267.89MB
下载
《山海旅人2》：水墨风格志怪解谜，团队冒险新篇章

类型：游戏下载大小：10M
下载

近期热点 +

最新技术文章 +

10-02

Apple Intelligence测试版现已开放：文本重写工具、闪亮新 Siri 设计苹果刚刚发布了 iOS 18 1、iPadOS 18 1 和 macOS Sequoia 15 1 的公开测试版，其中包括即将推出的 Apple Intelligence 功能，如
10-02

OpenAI 50-70 亿美元融资将完成，估值有望破 1500 亿美元科技媒体 The Decoder 昨日（9 月 20 日）发布博文，报道称 OpenAI 公司即将完成一轮价值 50 亿至 70 亿美元（当前约 352 76
10-02

家庭理论电费2022最新收费标准：各类电器的电费计算方法随着科技的发展和人们生活水平的提高，家庭中电器的种类和数量不断增加，电费支出也成为家庭经济中不可忽视的一部分。了解2022年最新的家庭
10-02

突发！高通有意收购因特尔：芯片行业或迎重大洗牌据《华尔街日报》报道，高通已就收购事宜与英特尔接洽。据称交易“远未确定”，但至少就此事展开了谈判。收购英特尔将是重大新闻，也是这家
10-02

夏普发布 AI Smart Link 可穿戴设备：挂在脖子上的 AI 助手，支持自然语言沟通在 9 月 17~18 日举行的夏普科技日活动上，夏普宣布与日本京都艺术大学合作，共同开发了一款可实现与生成式 AI 自然沟通的可穿戴设备