王小川Sora是阶段性产物百川不跟风

“
Sora的问世引领科技浪潮,但王小川对此却持有截然不同的看法。他强调,通用人工智能理想中,语言才是中心,而Sora只是阶段性产物。然而,对于通用人工智能之路,是否应该仅局限于语言智能仍有争议。王小川的言论引发思考:技术理想与应用场景,何者更为重要?百川智能如何在这一话题中定位?
Sora的问世毫无疑问地在科技圈掀起了轩然大波。作为全球领先的文本生成视频工具,Sora凭借其逼真的文字生成视频能力被誉为世界级模拟器。其技术实力和创新能力震撼了整个科技界,并对影视业产生了巨大冲击。国内外许多企业纷纷跟进,试图追赶OpenAI的步伐,推出类似产品。然而,王小川却对此持有迥然不同的观点。
王小川认为,尽管Sora具备强大的技术实力和惊人的创新能力,但 它仅仅是一个阶段性产物。他认为,Sora的高度、突破性以及应用价值均不及GPT,因此他的公司百川智能不会跟进这一领域。
王小川毕业于清华大学计算机系后加入搜狐,历经多年技术领域的工作经验。2010年,随着搜狗的独立分拆,他担任了搜狗的首席执行官,直到腾讯收购搜狗后结束了这段职业生涯。在2023年4月,王小川宣布将涉足大型模型创业领域。
在最近的一次采访中,王小川表示,他的团队有人提出要做Sora,但他明确表态称不会跟进这个方向。他强调指出:“为什么要做Sora?并不是有了一项技术就非得跟随。从AGI理想的角度来看,Sora与GPT不在同一水平线上。AGI理想必须以语言为核心进行建模。Sora无法取代语言的概念空间,它需要将语言融入其中,或者需要通过视频将语言融入其中,才能成为通往AGI的引擎。Sora只是一个阶段性的产物。”
王小川的言论似乎将通用人工智能的理想路径狭义地定义为以语言为中心。然而,通用人工智能的目标并不仅限于语言智能,还包括视觉、推理、规划和控制等各种认知能力。像Sora这样面向多模态感知的模型,有望融合语言、视觉等多种信息源,对于实现通用人工智能同样具有重要意义。
此外,王小川对于Sora模型的能力也存在低估。Sora并非简单地将语言“加进去”,而是致力于学习跨模态的表征,挖掘不同模态间的关联。这种统一的多模态建模思路有助于模型更好地捕捉语义信息,对于通用人工智能的发展也许更具价值。
对于“技术理想”和“应用场景”的对立,王小川表达了明确的立场。然而,将这两者对立起来可能有失公允。追求通用人工智能等技术理想并不意味着要完全忽视应用场景,二者可以相辅相成。只有在不断的实践和应用过程中,我们才能真正验证和推进技术的理想,因此,平衡这两方面的发展是更加明智的选择。
王小川进一步表示:“(我们)会做多模态,但不会复刻Sora,它既不代表AGI,也不代表场景,两者都不靠谱。过年后回来,大概在一星期内我们就形成了这样一个决定——我做了最终决定。”
然而,实际上,Sora作为一款文本生成视频工具,具有广泛的应用场景。它可以帮助内容创作者制作高质量的视频内容,加快教育和培训资源的传播速度,提升广告和营销的吸引力,创建虚拟演播室和虚拟主持人,以及辅助电影和电视制作。
将AGI和具体应用场景对立起来过于二元化。实际上,追求通用人工智能的理想和开发特定应用场景并不矛盾,二者可以相辅相成。通过应用场景的实践,我们可以积累经验,不断改进模型,推动AGI的发展;反之,AGI的突破也将为应用场景带来巨大的推动作用。
王小川明确表示公司不会跟进Sora。在外界看来,可能存在两种情况,百川智能专注于语言模型,并可能结合其做搜索引擎的背景,走Bing或者Perlexity AI的路线。另外一种可能是,对于去年4月才入局大模型的百川智能,追赶GPT已经耗尽了所有精力,根本无暇开拓其他方向。
百川智能是由王小川和茹立云共同 创立的公司,致力于研发和提供通用人工智能服务。该公司的目标是打造中国版的OpenAI,开发基础大模型及颠覆性上层应用,旨在推动人工智能技术的发展和应用。
百川智能成立后迅速发布了Baichuan-7B和Baichuan-13B两款开源可免费商用的中文大模型,并在多个权威评测榜单上取得了优异成绩。
2024年1月29日,百川智能发布了超千亿参数的大语言模型Baichuan 3,该模型在多个权威通用能力评测中表现出色,特别是在“迭代式强化学习”技术上取得了突破,显著提升了语义理解和生成能力。


共有 0 条评论