Databricks发布DBRX性能超ChatGPT为当前最强大开源模型

“
Databricks推出DBRX,一款1320亿参数的开源AI模型,性能超越GPT-3.5。采用创新“专家混合”架构,DBRX在语言理解、编程和数学基准测试中表现卓越,成本效益高,旨在推动开源AI发展,确立Databricks在AI研究领域的领导地位。
Databricks,这家在企业级软件领域迅速崛起的公司,近日宣布推出了一款名为DBRX的开源人工智能模型。公司宣称,该模型在开源AI的效率和性能方面树立了新的标杆,拥有1320亿个参数,并在关键的基准测试中超越了其他领先的开源模型,如Llama 2-70B和Mixtral。
虽然DBRX在原始计算能力上未能达到OpenAI的GPT-4模型的水平,但Databricks的高管们将其视为GPT-3.5的显著升级版本,并强调其成本仅为GPT-3.5的一小部分。Databricks首席执行官Ali Ghodsi在新闻发布会上表示:“我们很高兴能将DBRX推向世界,推动行业朝着更强大、更高效的开源AI发展。DBRX证明了我们能够为客户构建能够深入理解他们专有数据的定制模型。”

DBRX的一个显著特点是其创新的“专家混合”架构。这种架构通过包含16个专家子模型,并动态选择与每个令牌最相关的四个子模型,使得仅有360亿个参数在任何时刻处于活跃状态。这种方法不仅提高了运作速度,还大幅降低了成本。
DBRX的开发由Databricks去年收购的研究团队Mosaic完成,该团队基于其早期的Mega-MoE工作开发了这一方法。Ghodsi表示:“Mosaic团队在更高效地训练基础AI方面取得了显著进步。DBRX的开发耗时约两个月,成本约为1000万美元。”
Databricks通过开源DBRX旨在确立自己在尖端AI研究领域的领导地位,并推动其创新架构的广泛应用。DBRX的发布也支持公司的核心业务——基于客户私有数据集训练和托管定制AI模型。这对于那些依赖于OpenAI等其他供应商提供的模型的客户来说,提供了一个更安全、合规的选择。

尽管DBRX未能达到OpenAI的GPT-4模型的水平,但它在语言理解、编程和数学基准测试中显著优于广泛使用的GPT-3.5。Databricks高管强调,DBRX是一个成本效益更高的开源替代品。
在Databricks的核心数据和AI平台业务面临日益激烈的竞争之际,DBRX的推出恰逢其时。数据仓库巨头Snowflake最近推出了一项原生AI服务Cortex,该服务提供了与Databricks部分功能重叠的服务。同时,像Amazon、Microsoft和Google这样的云服务巨头也在争相将生成式AI功能整合到他们的产品中。
通过DBRX宣称拥有最先进开源研究的地位,Databricks希望将自己定位为AI领域的领导者,并吸引数据科学领域的人才。这一举措也顺应了对大型科技公司商业化的AI模型日益增长的抵制趋势,这些模型被一些人视为“黑箱”。
DBRX的真正考验将在于其在市场上的接受程度以及它为客户创造的价值。随着企业越来越希望利用AI的力量,同时保持对专有数据的控制,Databricks押注其结合尖端研究和企业级平台的独特优势将使其在竞争中脱颖而出。
Databricks通过DBRX向大型科技公司和开源竞争对手发起挑战,要求他们匹配自己的创新。随着AI领域的竞争日益激烈,Databricks明确表示,它将成为一个重要的竞争者。


共有 0 条评论