OpenAI确认ChatGPT会随着季节变懒

OpenAI确认ChatGPT会随着季节变懒-3

最近,ChatGPT-4用户纷纷观察到其变得“懒散”,引发OpenAI的关注。寒假假设成为研究者关注的焦点,一些测试结果显示与日期相关。这一现象揭示了大型语言模型领域的未知,AI研究者正努力解决和理解这一意外行为。

自11月下旬以来,一些ChatGPT用户纷纷观察到ChatGPT-4表现出更为“懒散”的特征,据称在执行某些任务时拒绝或返回简化的结果。OpenAI公司已经承认了这一问题的存在,但对其根本原因仍没有确切的答案。一些人提出了“寒假假设”的观点,尽管尚未得到证实,但AI研究人员对这种观点颇为认真,这反映了在AI语言模型领域的独特情况。

周四,ChatGPT官方账号在推特上发表声明表示:“我们已经听到了关于GPT4变得懒散的所有反馈!我们自11月11日以来没有更新模型,这并非故意行为。模型的行为可能难以预测,我们正在全力解决这个问题。”

周五,一位名为Martian的X账户公开对LLMs是否可能模拟季节性抑郁提出质疑。随后,Mike Swoopskee在推特上表示:“如果模型学到了从训练数据中获取的信息,即人们通常在12月放慢脚步,推迟到新年进行更大的项目,这是否是它最近变得更懒的原因呢?”

由于ChatGPT的系统提示包含了当前日期,有人开始认为这种奇怪的假设可能具有一定的合理性。为什么要考虑这样的假设呢?因为研究表明,像GPT-4这样的大型语言模型对人类式的激励会作出反应,例如在解数学问题之前建议机器人“深呼吸一下”。人们还以非正式的方式尝试告诉LLM,如果AI模型变得懒散,告诉机器人你没有手指似乎有助于增加输出长度。

周一,一位名为Rob Lynch的开发者宣布在X上测试了GPT-4 Turbo的API,并发现当模型输入12月的日期时,生成的内容相对较短(4,086个字符),而输入5月的日期时则较长(4,298个字符)。Lynch声称这些结果在统计学上是显著的。然而,AI研究员Ian Arawjo的回应称,他无法以统计学的显著性重复这些结果。(需要注意的是,由于LLM输出中存在随机元素,因此重复结果可能会很困难,因此人们对大量响应进行了抽样。)

OpenAI确认ChatGPT会随着季节变懒-4

截至本文撰写时,其他人仍在进行测试,结果尚不确定。这一事件揭示了LLMs迅速展开的世界,并深入探讨了计算机科学领域的未知领域。正如AI研究员Geoffrey Litt在推特上评论的:“最有趣的理论,我希望这是真正的解释。无论真假,[我]喜欢这个解释很难排除。”

关于“懒散”的历史

最早注意到ChatGPT变得“懒散”趋势之一是在11月24日通过Reddit发布的,在美国感恩节的第二天。一位用户在那里写道,他们让ChatGPT填写一个包含多个条目的CSV文件,但ChatGPT拒绝了,称:“由于数据的广泛性质,提取所有产品的完整数据将相当耗时。但我可以提供带有这个单一条目的文件作为模板,您可以根据需要填写其余的数据。”

12月1日,OpenAI员工Will Depue在X上确认,OpenAI知道关于懒散的报告,并正在努力寻找潜在解决方案。“我不是说我们不会有过度拒绝的问题(我们确实有),或者其他一些奇怪的事情(正在解决最近的懒散问题),但这是为了一次提供服务并尝试支持如此多用例的迭代过程的产物,”他写道。

ChatGPT可能一直对某些响应“懒散”(因为响应会随机变化),最近的趋势使每个人都注意到这种情况。例如,今年6月,有人在Reddit上抱怨GPT-4变得懒散。(也许ChatGPT正在暑假?)

ChatGPT 的迟缓最终可能对 OpenAI 的盈利来说是个好消息。由于所需的计算能力,运行高级语言模型的成本极其昂贵。研究公司 SemiAnalysis 在 2 月份估计,ChatGPT 每天给这家初创公司造成的损失接近 70 万美元。“聊天机器人越‘懒’,OpenAI 节省的钱就越多,系统承受的压力就越小,

此外,自GPT-4发布以来,人们一直在抱怨它失去能力。这些说法具有争议性,难以验证,使它们高度主观。还值得一提的是,当人们最近注意到升级到GPT-4 Turbo后拒绝执行额外工作的情况较多时,有人认为OpenAI正在测试一种尝试通过拒绝执行额外工作来节省计算资源的新方法。然而,OpenAI否认了这一说法,并表现得好像明显的懒散对公司和其他人一样令人意外。

版权声明:
作者:小火箭
链接:https://www.xiaohuojian6.top/405.html
来源:小火箭官网
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>