谷歌发布Gemini15多项指标碾压ChatGPT

谷歌发布Gemini15多项指标碾压ChatGPT-3

谷歌发布了Gemini 1.5,AI模型系列的重大更新,拥有史无前例的大型上下文长度。Gemini 1.5采用新的MoE架构,效率更高。Gemini 1.5 Pro性能与Gemini 1.0 Ultra媲美,但资源需求更低。其最引人注目的特点是超长上下文窗口,能处理高达1百万标记。

谷歌今日发布了其AI模型系列的一次重大更新,即Gemini 1.5。这次更新最引人注目的特点是其拥有前所未有的大型标记上下文长度。

Gemini 1.5采用了新的专家混合(MoE)架构,使其在训练和部署时更加高效。谷歌DeepMind的CEO Demis Hassabis指出,Gemini 1.5 Pro是这一最新一代的首个模型,其性能可与Gemini 1.0 Ultra相媲美,但所需的计算资源更少。

Gemini 1.5最显著的特点是其超长上下文窗口。这意味着它可以处理更大的查询并同时查看更多信息。该窗口的标记数量高达 100 万个,当前 Gemini Pro 为 32,000 个。标记是一个很难理解的指标,因此 Pichai 让它变得更简单:“大约 1小时的视频,11小时音频,数万行代码或超过700,000字的文档。”上下文窗口意味着您可以立即向人工智能机器人询问所有内容。

谷歌发布Gemini15多项指标碾压ChatGPT-4

与此相比,OpenAI的GPT-4 Turbo拥有128,000个标记,Anthropic的Claude 2.1拥有200,000个标记。谷歌的研究已测试了处理高达1000万标记的模型,表明其有效管理大量信息的能力。

首个发布的Gemini 1.5 Pro模型具有标准的128,000个标记的上下文窗口。然而,一小部分开发者和企业客户将提前获得一种版本,该版本的上下文窗口可处理高达1百万标记。

Pichai还认为,更大的上下文窗口对于企业来说将非常有用。 “这使得您可以在查询时添加大量个人上下文和信息,”他说。 “可以想象,我们极大地扩展了查询窗口。”他想象电影制作人可能会上传他们的整部电影并询问Gemini评论家会怎么说;他看到公司使用 Gemini 来查看大量财务记录。 “我认为这是我们取得的更大突破之一,”他说。

在“大海捞针”测试中,Gemini 1.5 Pro在高达1百万标记的数据块中99%的时间内能定位到目标文本,解决了“中间丢失”的问题。例如,它能够在近一天的音频中完美地找到隐藏的关键字。谷歌的Gemini团队在技术报告中指出,它还能够有效地从三小时视频中的随机帧中检索信息。

Gemini 1.5 Pro 接近 Gemini 1.0 Ultra 的性能水平

Gemini 1.5 Pro的核心能力跨越了文本、代码、图像、视频和音频等多个基准测试。根据31项基准测试,Gemini 1.5 Pro的胜率比Gemini 1.0 Pro高出87.1%,比Gemini 1.0 Ultra的胜率高出54.8%。这一新模型在各个领域都有所改进,包括数学、科学和推理、多语言能力、视频理解和代码。

开发者和企业客户可以通过AI Studio和Vertex AI获得Gemini 1.5 Pro的有限预览。谷歌在测试阶段免费提供此预览,尽管用户应该预期使用实验性功能时会有较长的延迟时间。谷歌计划根据模型上下文窗口的大小推出定价层次。

“当模型准备好更广泛地发布时,我们还将推出带有标准128,000个标记上下文窗口的1.5 Pro。即将推出的是,我们计划引入从标准128,000上下文窗口开始,逐渐扩展到1百万标记的定价层次,随着模型的改进。”谷歌DeepMind的首席科学家Jeff Dean表示。

如果谷歌能够在实验性模型中保持Gemini 1.5系列模型具有1百万甚至1000万标记上下文窗口的准确性和性能,那么这一模型及其后续模型将为科学和其他领域的多模态模型提供新的应用。这也表明,谷歌能够相当快速地迭代其Gemini系列,而谷歌与OpenAI和微软之间的竞争才刚刚开始。

版权声明:
作者:小火箭
链接:https://www.xiaohuojian6.top/469.html
来源:小火箭官网
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>