粗暴点说,当下大模型公司遇到的大多数问题,包括模型表现不好、找不到超级应用、落地场景少、客户留存差、商业模式不清晰等都可以归结到模型工艺还有待更多突破。
因此,工艺上追赶 OpenAI ,依然是中国大模型当下最迫切的任务。
今年 1 月,智谱推出第四代基座大模型 GLM-4,性能逼近 GPT-4,智谱取得的这一进展比国内其他大模型厂商都早,可以说一直以来,国内大模型的工艺突破主要看智谱。同时,过去一年里智谱以平均每 3 个月迭代一次的速度更新模型能力,领先于其他厂商。
各大模型公司参与价格战的目的是抢占客户,基础模型之外,开源生态也是大多数厂商不敢轻易放弃的一块。
过去一年里,智谱的ChatGLM-6B 开源模型受到了广泛关注和认可。今天召开的智谱小型品牌活动OpenDay上,智谱又推出了第四代 GLM 系列开源模型:GLM-4-9B,包括:基础版本 GLM-4-9B(8K)、对话版本 GLM-4-9B-Chat(128K)、超长上下文版本 GLM-4-9B-Chat-1M(1M)和多模态版本 GLM-4V-9B-Chat(8K)。
和之前发布的开源模型ChatGLM-6B相比,GLM-4-9B参数略多,预训练计算量增加了 5 倍,但仍然能在大多数客户的显存上运行。
经过工艺升级后,GLM-4-9B 模型具备了更强大的推理性能、更长的上下文处理能力、多语言、多模态和 All Tools等突出能力。
基于强大的预训练基座,GLM-4-9B 的模型中英文综合性能相比 ChatGLM3-6B 提升了 40%,尤其是在中文对齐能力 AlignBench,指令遵从 IFeval,工程代码 Natural Code Bench 方面都取得了非常显著的提升。
GLM-4-9B对比训练量更多的 Llama 3 8B 模型丝毫没有逊色,英文方面有小幅领先,中文学科方面更是有着高达 50% 的提升。
GLM-4-9B 模型的上下文从 128K 扩展到了 1M tokens,这意味着模型能同时处理 200 万字的输入,大概相当于 2 本红楼梦或者 125 篇论文的长度。GLM-4-9B-Chat-1M 模型在 1M 的上下文长度下进行了“大海捞针”实验,展现出了出色的无损处理能力。
同时,GLM-4-9B 支持包括汉语、英语、俄语、西班牙语、德语、法语等多达 26 种语言。
过去智谱通过开源积累了一批客户,其开源模型累计下载量高达 1600 万次,成为全球大模型开源生态中一股不可忽视的中国力量,第四代GLM-4-9B 开源模型的推出,进一步巩固了智谱在开源侧的作用力。
在当前大模型增长阶段,持续训练出好的基座模型+持续开源才是吸引客户、创建生态最稳健的策略,从而进一步实现客户留存。
放眼国内,智谱不仅在模型能力上不断取得突破,持续推出更先进的基座模型,在 B 端商业化探索上也至少领先行业半年:智谱从去年 3 月开始探索 B 端商业化(MaaS 模式),根据智谱此前官方消息,过去一年,智谱已经有2000+生态合作伙伴、1000+大模型规模化应用、与200多家企业进行了深度共创。
目前,智谱 MaaS 开放平台已经拥有 30 万企业客户和开发者、400 亿 Tokens 日均调用量 、过去6个月API每日消费量增长了50倍以上。
在此次价格战中,智谱并没有盲目跟进,而是迅速基于 MaaS(模型即支持)商业策略,并往后走到下一站——卷客户体验。
智谱GLM大模型首次推出一键微调,包括 LoRA 微调和全参微调。客户只需要三步,准备训练信息、创建微调任务、部署微调模型就能拥有自己的私有模型。
使得客户可以用更低的成本访问和门槛使用大模型,也促进了优秀的 AI 应用爆发。OpenDay 上,小米小爱总经理、AiPPT创始人等到场,讲述了基于GLM大模型做企业应用及创业项目的经历。
对于价格战,智谱CEO张鹏的态度是:打价格战,我们不怕,我们不仅打得起,而且不亏钱。这种底气是基于智谱基于自身强大的 GLM 模型能力,以及逐步完善的商业体系、团队的商业策略。
近期针对MaaS 平台智谱做出一系列价格下调。
张鹏表述,此次价格调整依然是智谱基于工艺突破、效率提升和成本控制的综合结果,是符合自身商业化策略,合理的价格调整。
当价格战最猛的时候,有人感叹“大模型这么不值钱吗”“大模型卖出了白菜价”,盲目价格战其实是对大模型行业的一种损伤——压缩了大模型厂商的盈利空间,打乱了大模型行业健康增长的节奏,更严重的是,一旦整个行业被拉进价格战的漩涡,中国大模型将会偏离主要目标,离 AGI 越来越远;同时价格战也加重了外界对大模型的质疑,怎么花费如此昂贵成本训练出来的大模型,突然就这么便宜了呢?这些厂商是不是闹着玩呢?对大模型的价值产生怀疑。
好的模型应该物有所值,一个行业健康增长的前提是,既能让大多人都能用得起大模型,实现工艺普惠,也能让大模型厂商有盈利的空间。
价格战往往只是拍拍脑袋就能做的决策,而对于当下中国大模型来说,探索多样化的增长路径,并且沿着这些路径坚持下去,才是中国大模型破局之道。
而对于当前的大模型玩家来说,如何在有限的资源、时间里,积累更多的筹码:融资、领先的工艺、稳定的商业模式,才能继续留在牌桌上,拥有更多机率实现共同的 AGI 星辰大海。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。
文章版权声明:除非注明,否则均为本站原创文章,转载或复制请以超链接形式并注明出处