对话王小川:国内在技术理想上拼不过OpenAI,但应用落地会跑得更快 DATE: 2023-12-01 04:19:13
出品 | 搜狐科技
作者 | 梁昌均
6月15日、川国7月11日、内技8月8日 。术理这是想上王小川自4月10日官宣创办百川智能入局AI大模型创业以来 ,先后推出三个大模型的应用时间。
过去的落地四个月里 ,百川智能的对话I但得更团队已增加到110多人 ,且先后推出7B、川国13B和53B三个不同参数规模的内技大模型,速度之快超出外界想象。术理
Baichuan-53B是想上王小川昨日发布的新一代大模型 ,它在预训练数据 、应用搜索增强、落地对齐能力等方面进行了优化。对话I但得更王小川称 ,这是一款通用大模型,在文本创作等文科能力上体现突出。
但不同于之前开源的7B 、13B ,王小川表示,从53B大模型之后就不再开源 ,因而部署成本较高。目前,这款模型已开启内测,下个月会开放API ,甚至开放组件,优先把2B的服务做起来 。
王小川透露 ,此前开源的7B和13B模型已有超过150家企业申请使用。对于为何要先做开源 ,王小川对搜狐科技解释称 ,开源必定程度是营销行为 ,可以后发制人 ,同时开源也是为商业化做储备,有各种用途和生态后 ,就有了收费的可能。
同时他判断,可能未来80%的企业都会用开源模型 ,闭源能力强 ,但成本非常高,而开源模型在很多地方非常好用 。“开源闭源不是竞争关系,而是不同场景下的互补的关系。”
随着百川智能继续做更大规模的闭源模型 ,也会面临不少挑战 。王小川表示,需要把模型做得足够好 ,同时要把推理成本降下来 。“这是世界性难题 ,作为新手还要摸索,但我们有能力做到极致优化。”
在算力层面,王小川表示国产芯片必定要顶上来 ,光英伟达还不够,这是整个行业面临的问题。他透露 ,目前百川智能的算力是通过云厂商实现,腾讯、阿里都在为其提供云服务 。
“我们说要做到中国最好的对标 GPT 的模型,这意味着对于预训练模型的追求不会停止,未来还会继续去做更大的模型。”王小川表示 ,百川智能既要做更大参数模型 ,后面还要做出差异化 。
此前7月底,王小川的前合作伙伴洪涛加盟百川智能 。王小川表示 ,这来代表公司在商业层面开头布局。“不管7B还是13B,还是53B ,更多是为2B行业做准备,团队也已经部署2C的超级应用 ,且未来不仅仅有一款。”
而在今年6月考察了美国后,王小川也将百川智能的发展策略从“理想上比OpenAI慢半步 ,落地上快半步”改成“理想上慢一步,落地上快三步”。他认为,国内在技术理想上拼不过OpenAI,国内离GPT-4都有距离 ,但应用落地会跑得更快。
对于目前的百模大战,王小川依然相信未来的五张船票会有百川智能的一席之地。他表示 ,钱非常重要,但最终决定能力的还是人才团队,尤其是组织能力,钱、组织能力是关键 。据他透露,百川智能初始估值5亿美金 ,第二轮可能就是10亿美金,目前融资也非常顺利 。
“大厂钱多、人多、算力多 ,但组织效率不必定够好 。组织效率对我们不是挑战,也有大厂相对完整的经验 ,要是钱能保证的话,能力会很强。”王小川表示,中国谁能做最好的大模型现在没有结论,还无法确定大厂小厂谁能取胜,做应用也是,都有争取的机遇 。
以下是媒体对话节选(经编辑整理)
谈开源:53B大模型后闭源 ,未来80%的企业都会用到开源
媒体:此前发布的7B和13B开源大模型落地应用情况怎样样 ?
王小川:我们是新兵 ,作为后发者进入市场,开源对我们来讲 ,能给中国的开源生态作一点儿贡献 ,同时展现我们的技术实力 ,开源后仅仅要持续不断技术迭代 ,就会有自己的商业模式。
现在有超过150家企业申请使用百川模型 ,很多都是行业头部企业。商业化工作也会开展起来 ,借助开源引擎,还有更好的参数模型 ,以及整套组件也在研发当中,能统一提供部署。
媒体