攻其不备Anthropic发布Claude21

攻其不备Anthropic发布Claude21-3

Anthropic发布Claude 2.1,具有巨大的上下文窗口,提供更强大的语言模型和聊天机器人。虽然有一些限制,但相对于前身有显著改进,包括减少错误答案和幻觉率。这一发布或许是Anthropic应对竞争对手OpenAI危机的战略举措。

主打一个上下文窗口

Claude 2.1的上下文窗口达到了200,000个标记,远超其前身Claude 2.0的100,000个标记,以及11月初被GPT-4 Turbo超越的128,000个标记。这一突破性的特性使得Anthropic再次成为市场上最具专注性的AI模型供应商之一。

上下文窗口的大小直接影响语言模型在生成答案时能够同时考虑多少信息。Anthropic表示,Claude 2.1的上下文窗口大约相当于150,000个词或超过500页的内容。这使得用户可以上传整个代码库、财务报告,甚至像《伊利亚特》或《奥德赛》这样的大型文学作品供模型处理,为应用提供更广泛的可能性。

Claude可以执行多种任务,包括汇总、问答、预测趋势和比较多个文档等。尽管生成答案可能需要几分钟的时间,相对于人工处理同样任务可能需要数小时的情况来看,这几乎可以忽略不计。

然而,虽然Claude 2.1的大型上下文窗口提供了强大的潜力,但在实际应用中仍然存在一些限制。测试表明,当输入的内容位于文本的中部或后部时,即所谓的“中间丢失”现象,大型语言模型检索内容的可靠性较低。输入的规模越大,错误的风险就越大。

这意味着尽管用户可以输入大型文档,但文档的某些部分可能不会被Claude 2.1考虑在内。正如GPT-4 Turbo的基准测试所示,模型最可靠地在文档开头找到信息。

为了更全面地了解Claude 2.1在这方面的表现,独立的基准测试将不可或缺。不过,Anthropic承诺相对于其前身,尤其是在处理更长内容时,Claude 2.1已经实现了显著的改进。

Anthropic的数据显示,Claude 2.1的错误答案率降低了30%。当模型不确定时,它会丢弃近两倍多的答案,并承认不确定性,这种改进有望提高用户的信任度和满意度。

更准确,更可靠的理解事情

Anthropic公司表示,相对于其前身Claude 2.0,Claude 2.1的幻觉率减少了一半。这一重要的改进意味着组织可以更加自信和可靠地构建AI应用程序,从而提高效率和准确性。

与新模型的发布一同推出的还有一个名为“工具使用”的测试功能,使Claude能够更好地与用户的现有流程、产品和API集成。Claude现在可以编排开发人员定义的功能或API,搜索网络资源,并从私有知识库中检索信息,为用户提供更多的智能支持。

为了让Claude API用户更容易测试新的调用并加快学习曲线,开发者控制台已经得到了简化。新的工作台允许开发者在一个富有趣味的环境中处理提示,并访问新的模型设置来调整Claude的行为,使开发过程更加顺畅。

Claude 2.1目前已经通过API提供,并在claude.ai上支持免费和专业版计划的聊天界面。需要注意的是,200,000标记上下文窗口仅适用于Claude专业版用户。Claude目前在95个国家提供服务,但不包括欧盟地区。

Claude 2.1的发布可能是Anthropic公司的一项战略举措,尤其是在竞争对手OpenAI陷入严重危机的时刻。有报道称,OpenAI的董事会已经与Anthropic的CEO接触,探讨合并的可能性。此外,据悉已有100多名OpenAI客户咨询了Anthropic的产品,显示出市场对Claude 2.1的巨大兴趣和需求。Anthropic是否能够借此机会扩大市场份额,还有待时间的检验。我们将密切关注这一领域的发展。

版权声明:
作者:小火箭
链接:https://www.xiaohuojian6.top/369.html
来源:小火箭官网
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>