认识一下击败OpenAI的微软新欢Mistral

认识一下击败OpenAI的微软新欢Mistral-3

法国初创公司Mistral推出了与OpenAI竞争的新型大型语言模型,展现出与美国巨头一较高下的决心。其独特模型在性能上几乎能与对手媲美,受到了巨头微软的关注。Mistral利用数据策划和政治智慧取得了成功,尽管尚未盈利,但其开放式竞争模式或将成为未来趋势。

有些竞赛在刚开始时就已经注定了胜负。在争夺最佳大型语言模型(llms)的竞争中,情况似乎如此。这些算法支撑着能够生成类似人类文本和其他输出的生成式人工智能。美国的OpenAI似乎已经领先一步。他们开发了世界上性能最强的llm,名为gpt-4。该公司正在积极获取人才、数据和计算能力,以构建更智能的模型。因此,它吸引了更多用户,带来了更多资本,用以进一步研发更复杂的模型。

但是,一家名为Mistral的法国初创公司正试图打破这种人工智能正循环。2月26日,他们发布了一款新的llm。这款模型名为Mistral-Large,从参数数量上来看(通常用来衡量模型性能的一种标准),它比gpt-4要小。尽管如此,它在一些重要的性能方面,比如推理能力,几乎可以与gpt-4相提并论。

认识一下击败OpenAI的微软新欢Mistral-4

Mistral还发布了一个以Mistral-Large为基础的ChatGPT竞争对手,Le Chat(法语发音le shah,与法语单词猫的发音相似,而不是英文中的同形异义词)。同时,他们还宣布与微软达成了协议,微软作为一家人工 智 能巨头,已经与OpenAI有着深入的合作关系。这家科技巨头将持有Mistral的少量股份,并通过其Azure云平台提供法国公司的模型。

Mistral证明了这个行业正在变得更加开放,不再被美国所主导。如果Mistral真的对OpenAI构成了严肃挑战,这也将证实这个行业的一些人的猜测: 在生成式人工智能领域,规模并不是唯一的重要因素。“不再仅仅是规模,而是创造力和速度 ,”Mistral的首席执行官阿瑟·门什表示。

这家法国公司的崛起就像它的名字一样迅速。 不到一年的时间,他们已经取得了不俗的成绩,目前只有25名员工 。尽管如此,他们的llm已经处于领先地位,领导着日益增长的开源模型群。与像gpt-4这样的专有黑匣子不同,这些模型的核心统计数据是公开的,任何人都可以访问并进行修改。这使得Mistral能够获得大量的资金支持 (5.31 亿美元 ), 估值超过20亿美元。主要的投资者包括硅谷的主要风投公司,如Andreessen Horowitz和General Catalyst,以及科技行业的知名人士,如谷歌前首席执行官埃里克·施密特。

Mistral的早期成功归功于 巧妙地将人才、数据和计算能力这三大人工智能的主要要素与政治因素相结合 , 而政治因素对于人工智能行业的重要性正在增加, 因为世界各国政府正在思考这项技术的潜力。

首先来看人才。另一家位于巴黎的人工智能公司Dust的联合创始人Stanislas Polu表示,Mistral是法国工程教育和美国大科技公司之间的“天作之合”。Mistral的六位创始人中有三位,以及其技术核心——门什、Timothée Lacroix和Guillaume Lample——都毕业于法国的精英技术学校。

与许多其他顶尖的人工智能科学家一样,他们曾在Google和Meta等美国科技巨头的研究实验室工作——不过,不同于其他人,这三位在巴黎的分支机构工作,而不是在伦敦或硅谷。这使得他们成为全球仅有的大约100位真正了解如何训练尖端模型的人之一。

他们似乎尤其擅长于调动数据来训练他们的模型——这是人工智能成功的第二个关键因素。门什不愿透露Mistral如何精心策划其训练集;他表示,这是他公司的竞争优势的来源。

但业内人士证实,Mistral在策划方面真的很聪明,例如过滤掉重复的或没有意义的信息。这使得Mistral的模型可以更小:Mistral模型的统计权重,或者说“参数”,计数以十亿为单位,而OpenAI的gpt-4估计为1.8万亿(这两家公司都对确切的大小保持沉默)。这使得客户可以在自己的计算机上运行它们,而不是在庞大的数据中心中运行,后者是许多专有模型所需的。

据门什介绍,Mistral专注于数据策划使得该公司能够比竞争对手更有效地利用计算能力,这是人工智能的第三个关键组成部分。与OpenAI花费1亿美元开发gpt-4相比,训练Mistral的最新模型的成本要低得多。Mistral的方法也使得客户更便宜地对其模型进行微调并运行它们。

从技术上讲,Mistral等初创公司享有“后发优势”,受益于OpenAI和其他公司所做的所有工作。General Catalyst的Jeannette zu Fürstenberg认为,在Mistral的情况下,技术实力与政治智慧相辅相成,这非常有帮助,因为许多政府都认为本土的llm将带来经济和战略优势。

所以,另一位Mistral的联合创始人是前法国数字部长Cédric O。O先生与该国总统埃马纽埃尔·马克龙保持着直接联系,后者对人工智能的一切事务都非常感兴趣。去年,欧盟的一项人工智能法案草案一经出台,就有可能迫使Mistral公开其数据配方,O先生在马克龙的支持下,协调了一次成功的法德联合努力,反对了这些规定。这些规定随后被从法案中删除。

现在的问题是,Mistral尚未产生实质性的收入,是否能将这种引人注目的技术政治混合物转化为利润。该公司的赌注是, 许 多企业,特别是欧洲企业,希望对他们使用的llm拥有更多的控制权,而OpenAI不愿意给予他们这种控制权,并且不想被锁定在另一个美国科技平台上 。思考的顾客认为,这些顾客愿意付钱给Mistral来维护和运行他们的模型。

潜在顾客可能会问自己一个问题,即世界将如何监管开源模型。关于它们是否会使恐怖分子和其他坏人建立生物和网络武器的激烈辩论已经平息。政策制定者的讨论已经从强调风险转向了潜在的好处:更多的透明度、更多的创新和减少对少数几家控制该技术的强大公司的依赖。

大西洋两岸的监管者到目前为止已经容忍了开源llms。但是,如果发现这些模型继续变得更强大或被滥用,例如在今年世界各地的选举中帮助传播虚假信息,O先生可能会再次忙碌起来。

避免政治反弹显然符合Mistral的利益,但游说成功也有一个反面。监管机构的宽容几乎肯定会导致更多的开源竞争。2月20日,芬兰公司Silo ai发布了一个比Mistral更加开放的新llm,它提供了有关其训练数据和完成任务的软件的信息。预计几个月后发布的新版本将在大多数欧洲语言中与现在在芬兰语和英语中一样出色。

最重要的是,目前还不清楚规模对生成式人工智能是否重要。当OpenAI最终发布其下一个模型gpt-5时,就会进行测试。如果它让Mistral-Large和其他更小的开源模型相形见绌,那么门什关于创造力和速度的说法可能会显得空洞。然而,在那之前,Mistral的故事将继续引人注目。■

本文转载自economist,由翻译整理,「原创」仅为了防止非法搬运翻译成果,所涉侵权请联系。

版权声明:
作者:小火箭
链接:https://www.xiaohuojian6.top/487.html
来源:小火箭官网
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>