Meta的开源大模型Llama 3在市场上遭遇冷遇,这一现象加深了业内对于大模型开源与闭源之争的关注。根据The Information的报道,Llama 3在亚马逊AWS上并未引起广泛关注,而AWS的企业客户更倾向于选择Anthropic的闭源大模型Claude。微软内部消息同样显示,Llama并非其销售重点,微软更倾向于将其推荐给那些具备较强数据处理能力的公司。
面对开源大模型在商业化道路上的挑战,Meta可能需要建立自己的AI产品销售团队,直接应对企业需求。这一系列事件揭示了开源大模型在商业化过程中面临的困境,即开源模型的实际表现和商业回报似乎未能达到企业客户的预期。
在国内,各大模型厂商根据各自的技术路径和商业策略,形成了不同的立场。那么,企业应该如何在开源与闭源之间做出选择?百度智能云AI与大模型平台总经理忻舟接受采访时,深入解析了开源与闭源之争的底层逻辑、商业策略,以及对未来市场的看法。
忻舟指出,大模型的开源与软件开源存在本质区别。开源模型通常只开放参数权重,而非训练源代码和训练数据等关键信息,这意味着社区开发者无法直接改进模型效果。此外,忻舟还强调,尽管开源模型看似免费,但在实际应用中,企业还需考虑“总账”,即包含技术和服务在内的完整解决方案的成本。
1、在大模型市场中,各厂商扮演的角色及其商业模式有哪些不同?
忻舟:在大模型领域,不同厂商的角色和商业模式有所区别。云服务商主要依赖算力资源的销售,无论是开源还是闭源模型,只要托管在其平台上,都能从中获益。另一些既是云服务商也是模型提供商,希望通过模型的调用来促进业务上云。而对于创业型模型提供商而言,随着各大云服务商下调模型价格,它们面临着严峻的挑战。
2、为何说“开源模型并不便宜,且技术会逐渐落后”?
忻舟:开源模型的技术落后主要体现在两个方面。首先,由于训练源代码和数据未完全开放,开源模型的效果提升受限于原始厂商的努力,而非社区贡献。其次,开源模型缺乏有效的商业模式支持其持续迭代,特别是对于创业公司而言,这可能导致技术逐渐落后。至于成本问题,虽然开源模型本身免费,但企业若要达到与闭源模型相同的性能水平,往往需要额外投入大量的资源。
3、为何在硬件成本方面,开源模型相较于闭源模型更为昂贵?
忻舟:多数企业客户会采用多种硬件以确保供应链的安全性和灵活性。对于开源模型而言,要在不同硬件上进行适配,成本较高。相比之下,闭源模型供应商可以通过规模化销售来分摊软硬件适配的成本,并提供更优化的工具链,从而节省客户的硬件资源成本。
4、开源模型与闭源模型分别适用于哪些场景?
忻舟:开源模型更适合学术研究和初步测试,而在严肃的商业项目中,闭源模型仍然是主流选择。对于那些对性能和效果要求不高但重视私有化部署和成本敏感的场景,开源模型可能是个合适的选择。
5、一些厂商试图同时推进开源和闭源两条路线,这种策略是否可行?
忻舟:虽然理论上可行,但实际上,开源模型在公有云上的吸引力有限。在私有化部署方面,这种策略在一定程度上有效,尤其是当企业从开源模型过渡到闭源模型时。然而,随着模型通用能力的提高,这种策略的价值正在减弱。
6、百度为何尚未推出开源模型?
忻舟:根据观察,公有云上调用量较大的仍是闭源模型,开源模型并未显著提升公有云生态。在私有化市场,随着客户对大模型认知的提升,开源闭源已不再是关键因素。
7、百度云推出的“千帆大模型一体机”是否代表了一种新的商业模式?
忻舟:在当前企业使用大模型的探索阶段,“千帆大模型一体机”提供了一个低成本、易于使用的解决方案。它不仅集成了百度自家的文心大模型,还兼容了主流的开源模型,为用户提供一站式软硬件服务。
8、企业自行训练行业模型的成本有多高?
忻舟:训练一个行业模型的成本高昂,具体取决于模型参数规模、所需数据量以及数据标注成本等因素。从零开始训练一个70b参数的模型,成本可能高达数千万元人民币。
9、企业如何判断是否需要开发行业模型?
忻舟:我们建议企业采取分步走的方式。首先是价值验证阶段,利用轻量级的大模型平台和成熟的应用快速验证效果。其次是深入对接企业的应用,进一步完善大模型基础设施。最后是实现全面创新和自主可控,企业掌握相关技术和人才培养,实现自主发展。
10、您如何看待未来一年的大模型市场?
忻舟:预计未来一年大模型市场将呈现三大趋势:多模态将成为新热点;基于大模型的应用将迎来爆发,尤其在Agent(智能体)领域;企业应用机会增多,如知识库、客服、数字人等领域。