IT之家7月7日报道,在今天举行的华为开发者大会2023上,华为云CEO张平安宣布盘古大模型3.0正式发布。
▲途远华为云官方直播,同张平安说盘古大模型3.0是完全面向行业的大模型系列,包括5+N+X三层架构。IT之家总结如下:第一层L0是盘古的五大基础大模型,包括自然语言大模型、视觉大模型、多模态大模型、预测大模型、科学计算大模型,提供多种技能满足行业场景。
盘古3.0为客户提供100亿参数、380亿参数、710亿参数、1000亿参数的一系列基础大模型,匹配客户在不同场景、不同时延、不同响应速度下的多样化需求。同时提供了一套全新的能力,包括NLP大模型的知识问答、副本生成和代码生成,以及多模态大模型的图像生成和图像理解。这些技能可以被客户和合作企业直接调用。无论模型有多大,盘古都提供了一致的能力集。
二层的L1层是n个行业大模型,不仅可以提供利用行业开放数据训练的通用行业大模型,包括政务、金融、制造、矿业、气象等。也可以根据自己的行业客户数据,为盘古L0和L1上的客户训练自己专有的大模型。
第三层,L2层,是为客户提供更详细场景的模型。它更侧重于特定的应用场景或特定的业务,为客户提供开箱即用的模型服务。盘古模型采用完全分层的解耦设计,能够快速适应和满足行业不断变化的需求。客户可以为他们自己的大型模型加载独立的数据集,升级他们的基本模型,并单独升级他们的功能集。
在L0和L1大模型的基础上,华为云还为客户提供了大模型行业开发套件。通过客户自身数据的二次训练,让客户拥有自己专属的大模型。同时,根据客户不同的数据安全和合规需求,盘古大模型还提供公有云、大模型云区、混合云的多样化部署形式。
据介绍,盘古可以做网络搜索、咨询专家、查阅案例、查阅书籍等。自己动手,让每一个开发者都能拥有自己的编程助手,甚至实现一个对话框代码生成,一键用例测试,一键自动标注,一个指令智能部署,大大简化了开发流程。
在气象学领域,盘古气象模型号称是第一个比传统数值预报方法更精准的AI预报模型,预报速度也有了很大提升。结果发现,要预测一个台风未来10天的路径,在一个有3000台服务器的高性能计算机集群上模拟需要5个小时。现在,基于预先训练好的盘古气象模型,研究人员只需在单台服务器上配置单卡,就可以通过AI推理在10秒内获得更准确的预测结果。张平安表示,盘古大模型3.0继续围绕“行业重塑、技术扎根、开放共飞”三大方向打造核心竞争力。