当前位置：网站首页技术文章正文

腾讯优图和上交大新招，用公开知识给大模型升级，效果超赞

来源：互联网发布时间：2024-10-01 09:19:19

在人工智能领域快速发展的今天，大型语言模型（LLMs）的应用正逐渐成为推动行业创新的关键力量。然而，为了使这些模型在具体的影视制作环节中发挥出更大的价值，如何有效地对其进行任务特定的性能提升，成为了当前研究的重点。近期，一项由上海交通大学与腾讯优图实验室联合开展的研究，提出了一个新的开源增强知识框架，旨在通过自动提取公开数据中的相关知识，以更加高效地提升模型在特定任务上的表现。

这项研究不仅在性能上超越了现有的基线和最先进的（SOTA）方法，更为重要的是，它为人工智能领域内外提供了新的思路和技术路径，特别是在利用有限的标注数据和丰富的外部资源方面。

研究背景显示，尽管LLMs已经在多种任务和领域展现了强大的能力，但在实际应用中，尤其是涉及到高度专业化的内容创作时，仍然面临着一系列挑战。传统的模型微调方法往往需要大量的标注数据和高昂的计算成本，这在许多情况下是不现实的。与此同时，虽然开源社区提供了丰富的微调模型和指令数据集，但在实际应用中，如何高效地利用这些资源，特别是当面临少量标注样本时，仍是一个亟待解决的问题。

腾讯优图和上交大新招，用公开知识给大模型升级，效果超赞

为了解决上述挑战，研究团队开发了一个基于K-shot有标签真实业务数据的开源知识增强框架。这一框架的核心在于，通过少量的真实业务数据，指导模型选择、数据筛选及模型融合等关键步骤，以实现对LLMs的定向任务增强。具体来说，团队首先构建了一个LoRA Bank，包含了从Huggingface精心挑选的38个具有代表性的指令数据集，这些数据集经过预处理和LoRA微调，形成了一个可供选择的预训练模型集合，为后续实验奠定了坚实的基础。

在此基础上，研究团队提出了K-shot引导的专家模型选择方法，通过综合考虑模型的推理困惑度、K-shot数据上的表现以及模型间的多样性，来筛选出最具潜力的模型组合。此外，团队还设计了一种相似性-多样性平衡的数据选择策略，确保所选数据既能与当前任务高度相关，又能保持足够的多样性，从而有效避免过拟合现象的发生。

最后，通过构建混合专家（MoE）模型结构，研究团队实现了对多个潜在有效LLMs的知识互补和协同优化，进一步提升了模型在特定任务上的表现。实验结果显示，与基线和其他SOTA方法相比，该研究提出的框架在多项任务上均取得了显著的性能提升。

腾讯优图和上交大新招，用公开知识给大模型升级，效果超赞

这项研究不仅为LLMs在人工智能领域的应用开辟了新的道路，同时也为其他领域内的任务特定模型优化提供了宝贵的参考。未来，随着技术的不断进步和完善，我们有理由相信，类似的技术将为影视内容创作带来更多的可能性和创造力。

相关教程

中国科学院发布八条诚信提醒，在科研活动中规范使用 AI 技术 9 月 10 日，中国科学院科研道德委员会公开发布《关于在科研活动中规范使用人工智能技术的诚信提醒》（以下简称《诚信提醒》），对中国
技术文章 09-29
[技巧] 开启Windows 11开发版桌面贴纸和自定义涂鸦功能微软早在Windows 11 Dev Build 25174版就增加贴纸功能 , 该功能现在在 Windows 11 22H2 中也能看到。不过自定义涂鸦功能暂时只能
技术文章 08-26
苹果AI服务Apple Intelligence：iOS 18.1更新代码暗示中国区支持尚待时日 iOS 18 1和macOS 15 1 Sequoia的Beta 1更新代码中发现了关于苹果Apple Intelligence的相关信息。基于代码字符内容，相关信息如下：iOS
技术文章 08-08

产业资讯

游戏下载 +

冰川时代生存(内购版)

类型：游戏下载大小：209.85MB
下载
堆叠太空

类型：游戏下载大小：40.31MB
下载
踢泰迪熊(Kick The Teddy Bear)

类型：游戏下载大小：12.51MB
下载
王牌总动员

类型：游戏下载大小：267.89MB
下载
《山海旅人2》：水墨风格志怪解谜，团队冒险新篇章

类型：游戏下载大小：10M
下载

近期热点 +

最新技术文章 +

10-01

调查显示英国 28% 成年人经历过“AI 拟声”骗局，46% 对此一无所知随着 AI 技术发展，电信诈骗分子也开始通过 AI换脸、AI拟声等手段试图骗取受害人的钱财。如今，这一新型骗局已经成为全球多国需要面对的
10-01

研究显示美国青少年热衷生成式 AI，家长大多不知情最新研究显示，美国青少年中七成以上曾使用生成式 AI工具，但超过半数家长对此一无所知。一项由 Common Sense Media 发布的新报告揭示
10-01

支付宝搞大模型医疗，技术老大说：我们从四方面入手随着大模型技术的快速发展，蚂蚁集团旗下的支付宝正积极布局医疗健康领域，成为这一领域的重要参与者。蚂蚁集团医疗技术负责人魏鹏在接受采
10-01

O1规划能力首次测试！不只聊天，这次preview真的赢了mini 在人工智能领域，尤其是大型语言模型的竞争中，o1-preview终于展现出了它独特的优势，成功在规划任务上超越了o1-mini，这一成果得到了亚利
10-01

OpenAI高层大换血：CEO不顾安全急推GPT-4，员工加班加点赶工，追求名利放弃初心近日，OpenAI内部的动荡逐渐浮出水面，CTO Mira Murati的离职再次引发业界关注。这一连串事件背后，与GPT-4o的匆忙发布有着千丝万缕的联