出品|虎嗅科技组
【资料图】
作者|齐健
编辑|陈伊凡
头图|FlagStudio生成
二级市场刚冷静了一点,ChatGPT的风暴又开始席卷创投圈了。
2月10日晚,原美团联合创始人王慧文的一条朋友圈在网络上热传,这条朋友圈的截图显示王慧文提出的“人工智能宣言”如下:5000万美元,带资入组,不在意岗位、薪资和title,求组队。
网传原美团联合创始人王慧文的朋友圈截图
两天后,王慧文本人在社交平台“即刻”上正式发文宣布,虽然目前还处在学习AI的阶段,但计划出资5千万美元,设立北京光年之外科技有限公司,打造中国的OpenAI。王慧文在博文中称,目前公司估值2亿美元,下轮融资已有顶级VC认购2.3亿美金。
“一石激起千层浪”,王慧文发布“AI英雄榜”后,2月14日,真格基金官方微信也发布了一则 “AI英雄帖”,称正在寻找有能力引领新一代创业公司的创始人。
源码资本创始合伙人曹毅在朋友圈也表示,行业也等到了老王出山。
而对于王慧文的这次AI创业,坊间议论最多的莫过于2亿多美金要撬动中国版OpenAI这么大的项目,可行吗?有哪些坑?又有哪些可能的商业化方向?
ChatGPT是怎么做出来的?
要做中国版的OpenAI,或许先要了解,OpenAI是怎么来的?它的“头牌”ChatGPT又是如何做出来的。
从现在来看,通用大模型的研究是一个烧钱的游戏,2亿美金可能不太够。OpenAI成立于2015年,从可以查到的融资纪录看,2016年-2022年,OpenAI的融资额可能超过30亿美元。
与多数创业公司一样,OpenAI在这些年中不太赚钱。甚至一开始完全是以非盈利机构的身份在开展AI研究。不赚钱的同时,OpenAI在研发方面还持续烧钱。有统计显示,GPT-3的一次模型训练费用可能超过百万美元,上线之后的ChatGPT每天回答问题的成本也是百万美元规模。
从研发的资金上来看,要在短时间内,用有限的资金复制OpenAI的成功恐怕并不容易。事实上,即便是资金量够大,AI大模型也不是说做就能做的。“这玩意儿不是屯点钱然后花点时间就能干成的。”一位AI行业专家如是说。
通用大模型的研究需要海量数据和技术创新的积累。要做一款像ChatGPT一样红到爆炸的产品,起码要分四步。
第一步,数据收集,通过爬取互联网上的大量语料数据来训练模型,语料数据包括了文本、对话和问答数据等。
第二步则是模型设计和数据预处理,OpenAI选择了Transformer模型作为ChatGPT的模型结构,并对其进行了许多改进,以提高模型的语言生成能力。对语料数据进行预处理,包括语料的清洗、分词和标注等步骤。
再之后是模型训练和模型评估,使用大量的计算资源和高性能的训练算法,对模型进行训练,使其能够生成高质量的语言文本。对模型的语言生成效果进行评估,并不断对模型进行调整和优化,以保证生成的语言文本具有足够的质量。
最后则是模型部署,将训练完成的模型部署到生产环境,供用户使用。
“如果你手里掌握着几十篇大模型领域顶会论文的技术积累,能够接受5年,甚至更长的时间,没有盈利,并耐心完成几百次AI试验。同时,有微软的Azure这样实力雄厚的公司提供几乎免费的云服务。”一位AI大模型专家向虎嗅表示,“(如果是这样的话)要做出ChatGPT,或者成为OpenAI其实并不难。”
从头做AI大模型道阻且长,需要耐心和长期投入。那么在资金量有限的情况下,能否先做一些能够较为快速实现商业化的产品?
不做中国OpenAI,AI领域创业还有几条路
如果不做OpenAI的话,笔者认为,以王慧文现有的资金量,5000万美元的起步资金和未来2.3亿美元的投资,在AI领域做出点事儿来,可能另外有几条路径可以尝试。
最简单的方法就是投资已有的大模型公司。不过,在技术和模型训练方面的积累是这类公司的核心。目前,不论国内还是国外,在通用大模型研究方面技术实力较强的公司多数是隶属于互联网巨头的AI部门或研究实验室。在这方面,优秀的初创公司不多,处于投融资早期的好标的更是凤毛麟角。
以5000万美元的资金量,其实可以尝试找一找在“文本生成模型、方法及装置”技术方面专利较多的,或是在Transformer大模型研究方面论文较多的AI公司,参与他们的中后期融资。不过,要做早期投资或是自己创业的话,这种方式应该是不在考虑范围内。
第二条路就是基于ChatGPT类的大模型产品做上层应用,目前这种模式可以说是通用大模型或是类ChatGPT产品方向比较靠谱的创业路径了。毕竟在美国,已经有一些通用大模型的SaaS服务商,跑出了成功的商业落地模式。
成立于2020年的AI独角兽Jasper的业务,就是通过调用OpenAI的GPT-3模型为用户提供文生文写作服务。虽然Jasper成立时间不长,但估值已达15亿美元。
在API调用方面,OpenAI最近也被爆出可能会增强这项业务,给调用API的用户提供更多优化和拓展空间。近期CNBC曾报道称,有知情人士透露,OpenAI可能在未来针对ChatGPT推出类似SDK的服务,可以让用户自己开发基于大模型的聊天机器人,用户可以根据需要引用特定来源的信息,以改进自己的聊天机器人。
OpenAI的官方公告中曾提到“正在积极探索低成本计划、业务计划和数据包的选项,以提高可用性。”
通用大模型正在逐步形成PaaS形式的平台能力,基于平台的SaaS服务,自然是一条很好的创业路径。不过目前,这条路最大的问题是,在通用大模型领域可以提供体验良好,且商业化成熟的API服务公司太少,且多为美国公司。而AI领域涉及大量创新科技和敏感数据,AI技术方面的跨国商务合作难免会收到数据安全,技术出口等方面的限制。
不过,国内公司在这方面也一直没有落后,目前北京智源人工智能研究院的悟道大模型、百度文心大模型等在API服务方面均已开展了相关的实验和探索工作。
最后,还有一条比较着眼未来的路径,那就是做大模型应用的外延拓展。
“ChatGPT最好的应用场景肯定不会局限在搜索引擎,而是更个性化的智能语音助手。”一位NLP(自然语言识别)研发工程师告诉虎嗅,不管是Bing还是谷歌,在搜索领域的AI探索应该都处在试水阶段。而基于大模型和自然语音、语意理解的语音助手肯定是未来的大方向。
目前,亚马逊的人工智能助手Alexa就正在引入基于Transformer的大规模多语言模型AlexaTM(Alexa Teacher Models)。百度即将推出的“文心一言”则计划与小度深度整合,打造针对智能设备场景的人工智能模型「小度灵机」。
除了生活需求,基于通用大模型的AI语音助手,更加适合做成专业领域的智能助理,比如给制造业、工程建设行业提供技术支持,或是在医疗专业知识方面,给医生提供参考建议。
一位工业领域专家给虎嗅举了这样一个例子:你想在家里挂一幅壁画,需要在墙上打个钉子。当施工工人拿着冲击钻,准备打眼儿的时候,他需要了解面前这堵墙的一些信息,例如墙里是否预埋了电路?是否有水管?要打眼的位置有没有钢筋?
这些信息要如何得知?要么问记得管线位置的主人,要么问装修的工长,要么看装修的图纸。这时,如果前面的三个选项都不可用,那么有一个对你家里信息了如指掌的智能AI,提供这种信息查询服务,不就大幅简化这个过程了吗?
虽然现在市面上不乏各种类型的语音助手,且它们已经能给人类提供很多帮助了,但多数此类产品只能理解预设的问题,回答预设的答案,很难提供通用性的帮助。
“ChatGPT还真是挺神奇的,什么都知道。”一位航空领域的技术专家对虎嗅表示,他曾尝试向ChatGPT询问了一些航空领域的技术问题,比如:基于点云重构曲面的方法,飞机隐身特性和外形参数的关系。都没能难倒ChatGPT,且得到的回答非常专业。
ChatGPT虽然知道的多,但是要真用它给专业技术领域提供支持还有个很大的问题,就是准确性。很多人在与ChatGPT对话过程中都遇到过“AI编造事实”的现象,中文互联网上流传比较广泛的例子包括“林黛玉倒拔垂杨柳”“贾宝玉最应该与贾母在一起”等,在专业领域的应用很难容忍这种错误。
因此,类似ChatGPT的产品要想应用在专业领域,还需要解决稳定性和可靠性的问题,在优化AI、增强AI准确性方面或许可以给新的AI创业公司提供方向。
给通用大模型,或是类ChatGPT产品提供适合AI训练的高质量行业知识库,以及持续的知识更新服务,或许会成为未来的一项AI行业服务。在强化学习、自监督学习和行业数据包(知识库)等方面做技术升级,帮助大模型公司对AI进行强化学习训练,从而提高ChatGPT的准确性和可靠性。
顺着这个方向再向下延展,在自动驾驶,生物制药等领域也有很多基于通用大模型的创新机会。目前,百度文心、毫末智行、小鹏等国内公司已经开始在自动驾驶研究方面引入大模型技术,其中包括通过图文弱监督预训练模型,利用大模型数千种物体识别能力,扩充自动驾驶语义识别数据。以及利用ChatGPT的“人类反馈强化学习(RLHF)”技术改进自动驾驶决策等。
AI创业,尤其是大模型创业,从现在开始干,或许已经有些晚了。
从资本市场角度看,中国二级市场注意到ChatGPT的速度已经比一级市场和整个AI圈子晚了2个月。
如果技术方面看,OpenAI在2015年成立,谷歌在2017年发布Transformer,2018年OpenAI推出了GPT的第一个版本,2022年底,现在的ChatGPT才第一次上线。即使一家公司已经具备了OpenAI在2020年推出的大模型GPT-3的水平,现在开始也要3年的时间才能追上ChatGPT。
目前OpenAI的估值达290亿美元,2019年微软就对OpenAI投资了10亿美元,并为之提供了大量基于Azure的云服务支持。
而在今天,对于没有微软这样一棵大树可以依靠的初创公司来说,最好的情况或许是,用2.3亿美元给“中国的OpenAI”打开一个起步的局面,不过这个起步积累的阶段,可能会非常长。
在ChatGPT之前,中国整体的AI创业并聚焦到大模型研究方面。多数公司都是在做实际场景落地的小模型,而大模型似乎更需要在沉寂中爆发,需要技术积累到一定程度的涌现。虎嗅接触过的国内的大模型初创公司的创始人都有一个共性的特点,他们普遍倾向于在技术实现了重大突破,或是找到典型应用场景之后再去讲技术,讲产品。
“大模型研究需要耐得住寂寞,厚积薄发。”一位AI公司创始人告诉虎嗅。