如果说OpenAI的O1开业内大模型推动System 2思考之浪潮,深度求索的deepseek以其极强的工程化能力一手力推了业内大模型迅速白菜价化,阿里通义千问自身开源闭源两路一同高歌猛进,更是在qwen2.0和qwen2.5发布后均力压meta的llama系列成为世界上最好的开源模型,那零一万物则一直扮演着一个疯狂追逐热点的“小丑”形象:李开复领导下的零一万物初代Yi模型被质疑换皮llama(后来的辩解非常抽象);模型在各种榜单上刷爆所谓SOTA但实际效果一般;2023年年中成立后到现在产品路线模糊,定位不清晰,原本all in C端在被市场暴打后仓促转向B端;再到黄文灏等核心人才出走加入豆包……
我直说吧,从一位金融壬的角度,零一万物并不能被视为一件值得投资的标的物。
在分析零一万物之前,我们需要先探讨一个议题——当前国内,乃至全世界除了OpenAI之外的大模型独角兽共同面临的问题都有哪些?
一、独角兽们的集体困境
我觉得最明显的问题就是:烧钱,并且是遥遥无期的烧钱。
从OpenAI正式推出ChatGPT之后,全世界的投资市场都彻底的被AI浪潮引爆,并且维持了一段时间的极度繁荣((从2022年12月到2023年6月),在这一时期整个VC/PE圈近乎彻底疯狂,每一位投资人和创业者都在念叨“大模型”、“新时代”、“第X次科技革命”等热词,认真的(相当大一部分人是假装自己能读懂)看各类前沿大模型研究论文,转发各种研报和AI早报……
在这一阶段,投资市场的ai板块极度繁荣,市场上崛起了一大批大模型独角兽(基本都以中美为主,日韩欧俄似乎只出了Mistral一根法国独苗,还被微软给吞了),各种融资一轮一轮的给,每一位独角兽的创始人都意气风发,势要将全人类直接送到后ai时代。
当然,后面的事我们都知道了。
一大群独角兽和AI labs正在以非常离谱的估值在市场上狂揽资金,但彼此间做的事情却几乎完全一样:拿OpenAI的模型训练自家的模型-给科技媒体发通稿一顿吹-安抚投资人投钱然后继续砸钱(每次训练百万千万不等)标定OpenAI训练自己的新模型……随着模型能力提升速度的边际递减,过去大家坚信的“Scaling Law”技术曲线已经明显放缓。OpenAI的GPT-5发布一再推迟,行业龙头在内斗中也颓势逐显,长期拿不出真正颠覆性的新活。
我们当然不能否认闭源模型和开源模型和研发对于科研教育市场和科技爱好者的重要性,但大模型的研发训练成本极为高昂,多次训练的压力对于弹药库非常珍贵的独角兽公司来说是难以承受的,而且即使大家愿意投入巨资,一旦市面上的头部企业发布了新的开源模型,原本的投入可能会变得毫无意义(例如meta的llama,阿里的qwen,发布之后很多公司自己炼的模型可以直接作废了,因为拿人家的开源模型效果还会更好)。
在研发端大模型研发(成本)是一个资金黑洞,那消费端(营收)呢?
很遗憾,这块更拉跨,至少对于独角兽来讲是拉跨的。
大模型在产业端究竟该如何应用?
我觉得可以分为两个层面。第一,大模型本身就构成了产业的核心商业模式和关键要素,以C端为主,抛开最原始的Chatbot不谈,软件层面包括最近风头比较旺的虚拟陪玩,社交领域的角色扮演,游戏行业的NPC,这一类场景是AIGC的上下游,有自己独特的工作流且一部分已经经历了PMF验证,但涉及到用户群体、内容创作的持续性以及虚拟人物的生命周期限制,当前的市场总量仍然非常非常非常的有限,可能做到底一年也只有数亿的流水。除了这种细分场景外还有硬件上的革新,例如AI PC和还有Apple和荣耀力推的AI手机,乃至于字节的豆包耳机ai pin等,都有一定的应用场景(但仍然非常有限)。这一大类软硬件模式可以称为大模型对于商业模式的大升级,或多或少可以把模型集中到新的商业模式中作为关键变量。
第二类,是庞大的B端企业级市场,这类未必是对商业模式做了根本性重塑,而是在降本增效场景作用比较突出,比如最典型的客服场景、知识库的问答等等,这些场景在企业内部对提效来说有非常多的帮助。比较好的案例是阿里巴巴旗下的很多产品都使用了通义千问的模型能力,百度的comate阿里的通义灵码在b端也采购的比较多。
一个比较有趣的视角就是,第一类应用是“先有模型,再找场景”;第二类应用则是“现有场景,再找模型”
目前,市面上主流的大模型独角兽都还简单的停留在第一类应用上面,模式以简单的Chatbot为主,兼买点大模型api来自己骗自己真的会有开发者和公司来采购。
什么?你说为什么他们不去做B端?
非不为也,实不能也。
更细的我懒得解释了,B端是什么阿猫阿狗刚创业几个月的公司就能碰的吗,BATH下一轮给你的融资不想要了是伐?
这就是AIGC落地的普遍问题——创始人该如何找到PMF?如何找到一个合适场景,可以解决实际的问题,可以落地,而不是仍然沉浸在自己的叙事中造概念追热点。
一个成功的大模型公司需要回答以下几个关键问题:
- 市场需求是什么? 是否有真正的痛点,大模型能够比现有解决方案更好地满足这些需求?
- 产品价值如何体现? 用户为什么会愿意为你的产品买单?这种价值是否是持久的,还是仅仅停留在新鲜感的层面?
- 商业模式是否可持续? 企业能够通过什么方式建立起长期的盈利能力?这种模式能否复制和扩展?
很可惜,独角兽们并没有一个真正合理的叙事框架来回答这些问题。
最后我中译中总结一下,对于当前大部分大模型独角兽企业,他们共同面临的困境是:需要的钱永无止境,但现在能挣到的钱屈指可数,未来预期更是迷雾重重。
今天很困难, 明天更困难,后天不知道
在缺钱并且挣不到钱这个核心问题之外,还有一个比较重要的方面是除了OpenAI之外的其他ai企业目前都只能追赶OpenAI的步伐,难以先于OpenAI做出新的比较彻底的创新,但这块我并不专业,讲了一定会露拙,所以不讲。
二、乏善可陈的模型更新
哦,当然,我们的李开复院长认为刚发布的Yi-Lightning是正式辟谣零一万物放弃预训练的有力证明。
但他发的那一段话真的可以说服他自己吗?
据介绍,在国际权威盲测榜单 LMSYS 上,Yi-Lightning 超越GPT-4o-2024-05-13、Claude 3.5 Sonnet,排名世界第六,中国第一。
经典刷分王,实测能力味如鸡肋,更何况LMSYS本身公信力就已经弗如去年远甚。
目前,Yi-Lightning已在Yi大模型开放平台上线,价格是0.99元/100万Tokens。在和媒体交流时,李开复多次提到这是“白菜价”,但表示“零一万物还是有利润空间的,不参与价格战”。
无非是deepseek、阿里、字节等友商早在今年年终就把大模型成本大幅压缩的技术路径给提前铺好了,直接拿过来很方便就能用;今年五月信誓旦旦不参与价格战的通稿还在网上挂着呢,自己模型做的没特色没客户买账回旋镖终于打到自己身上了。
他不是知错了,他只是知道他要死了.jpg
李开复驳斥了关于中国无法进行大模型预训练的说法,表示零一万物不仅不会放弃预训练,而且在速度和质量上都达到了领先水平。这次超越GPT-4o,也表明中国与美国最先进的OpenAI模型之间的差距已缩小到仅5个月。
懒得喷,有本事你跟深度求索月之暗面阿里一样为天下先,做出一点真正的前瞻性的工程探索。
Yi-Lightning模型在现在的市场地位如同鸡肋,价格相近的有深度求索阿里豆包智谱,这四家久经市场验证客户才懒得迁移到你李博士这里(况且最考验团队模型雕花能力的工程细节零一万物也做的并不好),海外有OpenAI的4o mini和虎视眈眈的Claude 3.5 haiku(尚未发布),零一拿头去和其他友商竞争。新模型的唯一用处就是拿出来自己骗自己发一波通稿辟一波谣了,不会真的有成熟开发者和团队会放弃之前已经习惯的成熟模型转而选择零一的。
三、总结
零一万物从创立之初就定位不清职责不明,既没有那种深度求索和月之暗面潜心打磨产品和基座模型的技术理想,也没有阿里字节这种恐怖的渠道优势和产业整合能力,刷榜和白菜价打价格战在骗自己和投资人之外没有任何实际用处。市场上早已不缺一家新的AI lab,具有稀缺性的是能深刻理解行业痛点并提供切实可行解决方案的企业,而零一万物显然还没有找清楚自己的定位。
在他找清楚之前(我质疑它是否有这个能力),我只能对零一万物未来的发展持谨慎态度,并倾向于看空其长期表现。