ChatGPT进入教室LLMs如何改革教育

小火箭 • 2026年1月18日 am12:44 • 小火箭, 小火箭下载, 小火箭加速, 小火箭加速器, 小火箭官网, 小火箭节点

图：尽管存在风险，一些教育从业者看到了利用人工智能聊天机器人来提升教育和学习的巨大潜力。

“

研究人员、教育从业者和企业正在尝试将有缺陷但广受欢迎的大型语言模型转化为可信赖、准确的“思维伙伴”来促进学习。

本文转自《Nature》

作者：Andy Extance，由翻译

上个月，教育心理学家罗纳德·贝格托（Ronald Beghetto）邀请了一群研究生和教育专业人士以不寻常的方式讨论他们的工作。除了相互交流，他们还与贝格托设计的一组以创意为中心的聊天机器人交谈，这些机器人不久将托管在亚利桑那州立大学（Arizona State University，ASU）运营的平台上。

这些机器人使用与著名且能进行自然对话的ChatGPT相同的人工智能（AI）技术。贝格托要求这些机器人扮演不同的角色，以激发创造力，例如故意挑战某人的假设。一名学生与聊天机器人讨论了各种论文课题，而讲师们则讨论了如何设计课程。

反馈非常积极。一位参与者表示，他们以前曾尝试使用ChatGPT来支持学习，但并没有发现它有用，不像贝格托的聊天机器人那样。另一人问：“这些东西什么时候会提供？”这些机器人帮助参与者产生了比他们想象的更多的可能性。

许多教育工作者担心ChatGPT的兴起会使学生更容易在作业中作弊。然而，位于坦佩的贝格托等人正在探索大型语言模型（LLM）如ChatGPT在教育中的潜力。

利用LLM阅读和概括大段文本可以节省学生和教师的时间，帮助他们更多地关注讨论和学习。ChatGPT的能力几乎可以清晰地讨论任何话题，这引发了使用LLM创建个性化、对话式教育体验的可能性。一些教育工作者将它们视为潜在的“思维伙伴”，可能成本低于人类导师，并且不受时间限制。

“一对一辅导是最有效的教学干预手段，但非常昂贵且不可扩展，”伊利诺伊州尚佩恩（Champaign）的技术公司Wolfram Research的联合创始人西奥多·格雷（Theodore Gray）表示。“人们尝试过软件，但通常效果不太好。现在有真正的可能性，可以开发出有效的教育软件。”格雷告诉《自然》杂志，Wolfram Research目前正在开发基于LLM的导师，但并没有透露太多细节。

这样的AI伙伴可以用来逐步引导学生解决问题，刺激批判性思维，或者像贝格托的实验一样，增强用户的创造力并拓宽考虑的可能性。田纳西州纳什维尔的范德堡大学（Vanderbilt University）未来学习和生成AI倡议的主任朱尔斯·怀特（Jules White）将ChatGPT称为“思维的外骨骼”。

风险确实存在

自从加利福尼亚公司OpenAI于2022年11月推出ChatGPT以来，它在教育中的应用一直备受关注，但多数关注都是负面的。大型语言模型（LLMs）通过从包含数十亿示例的训练数据中学习单词和短语之间的关系来工作。作为对用户提示的响应，它们生成句子，包括对作业问题的答案，甚至整篇文章。

与以前的AI系统不同，ChatGPT的答案通常写得很好，看似经过充分研究。这引发了担忧，即学生可能只需让ChatGPT代替他们完成作业，或者至少他们可能会依赖聊天机器人来获取快速答案，而不理解其理论基础。

ChatGPT也可能引导学生走入歧途。尽管在许多商业、法律和学术考试方面表现出色，但该机器人脆弱，如果问题措辞略有不同，就会出错，甚至会编造事实，这被称为“幻觉”问题。

加州大学洛杉矶分校的计算机科学家王玮（Wei Wang）发现，GPT-3.5（免费版本的ChatGPT）及其继任者GPT-4，在物理、化学、计算机科学和数学等来自大学教材和考试的问题上进行测试时，犯了很多错误。王玮及其同事尝试了不同的查询方式来测试这两个GPT机器人。他们发现，最佳方法使用了GPT-4，并且使用这种方式，其机器人可以正确回答约三分之一的教材问题（见“AI的教材错误”），尽管在一次考试中得分达到80%。

隐私问题是另一个难题：一旦学生们意识到他们在与LLMs合作时所键入的一切都被OpenAI存储，并可能被用来训练这些模型，他们可能会不太愿意定期使用LLMs。

拥抱LLM

但尽管存在挑战，一些研究人员、教育工作者和公司仍然看到了ChatGPT及其基础的LLM技术所具有的巨大潜力。与贝格托和Wolfram Research一样，他们正在尝试如何最好地在教育中利用LLMs。有些人寻找ChatGPT的替代品，有些人找到了减少不准确信息和幻觉的方法，还有一些人在增进LLMs的特定主题知识方面取得了进展。

“LLMs是否有积极的应用？”北卡罗来纳州立大学计算机科学家科林·林奇提出了这个问题。“当然有。但同时也存在巨大的风险和担忧。但我认为有方法可以降低这些风险。”

社会需要帮助学生了解LLMs的优势和风险，而不仅仅是禁止他们使用这项技术，联合国教科文组织（UNESCO）未来学习和创新主任索比·塔维尔在巴黎表示。今年9月，联合国教科文组织发布了一份名为《教育和研究中生成式人工智能指南》的报告。其中一个关键建议是，教育机构在使用像ChatGPT这样的工具来支持学习之前，应该对其进行验证。

一些公司正在推广商业助手，如MagicSchool和Eduaide，它们基于OpenAI的LLM技术，帮助学校教师规划课程活动和评估学生的工作。学者们也开发了其他工具，例如宾夕法尼亚州立大学（State College）计算机科学家Rebecca Passonneau团队创建的PyrEval4，用于阅读文章并提取主要思想。

图：一些大学可能很快会引入一种人工智能工具，它能够整合来自教材和科学论文的知识。图片来源：泰·赖特/彭博社通过盖蒂图片社

在威斯康星大学麦迪逊分校的教育心理学家Sadhana Puntambekar的帮助下，PyrEval在过去三年中每年对大约2,000名中学生在科学课上写的物理论文进行了评分5。这些论文并不被传统方式评分，但PyrEval使教师能够迅速检查作业是否包含关键主题，并在课堂上提供反馈，这是以往不可能的。

Puntambekar表示，PyrEval的评分还帮助学生反思他们的工作：如果AI没有检测到学生认为已经包含的主题，这可能表明需要更清晰地解释这个想法，或者他们犯了一些概念或语法错误。该团队现在正在要求ChatGPT和其他LLMs执行相同的任务，并进行比较结果。

AI导师登场

其他机构利用AI直接辅助学生。这是除了ChatGPT本身之外，也许是最广泛使用的基于LLM的教育工具的方法；那就是AI导师兼助教Khanmigo。这款工具是OpenAI与加利福尼亚山景城的教育非营利组织Khan Academy合作的成果。利用GPT-4，Khanmigo为学生在练习中提供建议，为教师节省了时间。

Khanmigo与ChatGPT的工作方式不同。它会以弹出式聊天机器人的形式出现在学生的电脑屏幕上。学生可以与它讨论他们正在处理的问题。在将学生的查询发送给GPT-4之前，该工具会自动添加提示，指示机器人不要透露答案，而是提出许多问题。

学院的首席学习官克里斯汀·迪塞博将这一过程称为“富有成效的斗争”。但她承认Khanmigo仍处于试点阶段，问题难度与有助于学习的问题之间存在微妙的平衡。“关键在于找出那个平衡点在哪里，”她说。

Khanmigo首次亮相是在今年的三月，根据可汗学院的说法，今年学校有超过28,000名美国教师和11-18岁的学生正在试用这款AI助手。用户包括私人订户以及30多个学区。个人每年支付99美元以支付LLMs的计算成本，学区每年每名学生支付60美元以获得访问权限。为了保护学生的隐私，OpenAI已同意不使用Khanmigo的数据进行训练。

但Khanmigo是否能真正改变教育尚不明确。LLMs只会包含句子中下一个最可能的单词，而不会核实事实。因此，它们有时会出错。为提高准确性，迪塞博表示，Khanmigo发送给GPT-4的提示现在包含正确答案以供参考。然而，它仍然会犯错，Khan Academy要求用户在发现错误时告知该组织。

林奇表示，Khanmigo似乎表现不错。但他警告说：“我还没有看到明确的验证。”

更一般地，林奇强调，任何在教育中使用的聊天机器人都必须仔细检查其语气，以及准确性，不能侮辱或贬低学生，或让他们感到迷失。“情感对于学习至关重要。你可以通过错误的方式来帮助某人，从而合法地破坏他们对学习的兴趣，”林奇说。

迪塞博指出，Khanmigo对每位学生在每种情况下的回应都不同，她希望这将使该机器人比以前的辅导系统更具吸引力。Khan Academy预计将在2024年底或2025年初分享有关Khanmigo的有效性的研究。

其他辅导公司正在为学生提供LLMs作为助手，或正在进行试验。总部位于加利福尼亚圣克拉拉的教育技术公司Chegg于今年四月推出了一个基于GPT-4的助手。而位于北京的中国公司好未来创建了一个名为MathGPT的LLM，声称在回答数学特定问题方面比GPT-4更准确。MathGPT还旨在通过解释如何解决问题来帮助学生。

增强检索

创建人工智能学习伙伴的另一种方法是将LLM与已经经过严格验证的外部专注知识语料库（如教科书或一系列科学论文）集成在一起。这种检索增强生成（RAG）方法的目标是避免无法验证数十亿文本源的情况，这些文本源赋予LLM会话能力。

纽约市的AI公司Merlyn Mind正在其面向教育的开源Corpus-qa LLM中使用RAG。与ChatGPT不同，Merlyn Mind的LLM最初是在与教育无关的大量文本上进行训练的，这赋予了它会话的能力。

但与ChatGPT不同的是，当LLM回答查询时，它不仅仅依赖于其在训练中学到的内容。相反，它还参考了特定的信息语料库，这有助于减少产生幻觉和其他错误的可能性，该公司的首席执行官萨蒂亚·尼塔表示。Merlyn Mind还对其LLM进行微调，以“承认”如果LLM没有高质量的答案，就会努力产生更好的答案，从而在许多情况下抵制幻觉，尼塔说。

亚利桑那州立大学（ASU）也在使用 RAG，这是最积极采用 LLM 技术的大学之一，据纽约市教育技术公司 GSV Ventures 的投资者克莱尔·赞（Claire Zau）表示。在进行了一次狭小的测试发布后，ASU于十月份推出了一个工具箱，允许其教职员工通过网络界面在教育中尝试使用LLM技术。这包括访问六种LLM，包括GPT-3.5、GPT-4和Google的Bard，以及RAG功能。

这些工具将允许更多的研究人员，如贝吉托，为他们的学生构建可以与之互动的聊天机器人。在他的首次研讨会之后，贝吉托计划在他正在开发的课程中使用这些机器人。亚利桑那州立大学在其私有云中托管了LLM的安全版本，以减少隐私方面的担忧，亚利桑那州立大学AI加速部门的执行董事伊丽莎白·赖利（Elizabeth Reilley）在凤凰城工作。

赖利表示，这些机器人已经对亚利桑那州立大学的教育产生了积极影响。例如，她说，ASU的初级化学课程中创建的一个机器人使用RAG将GPT-3.5与PDF和PowerPoint课程材料相结合。她举了一个测试的例子，想象一个热爱棒球的学生向LLM询问关于分子中偶极-偶极相互作用的解释，回答是准确的解释，并融入了“棒球隐喻，使其更具意义”。

与以前的机器学习方法不同，使用通用LLM与RAG结合，这些方法试图训练一个可以模拟科学专家的AI系统，亚利桑那州立大学坦佩分校学习工程研究所的执行董事丹尼尔·麦克纳马拉（Danielle McNamara）表示。那些工具缺乏通用性能，例如将棒球纳入化学概念的能力，这可能有助于学生。麦克纳马拉和她的同事现在计划研究ASU使用的聊天机器人和LLM工具的有效性。

其他机构也在采用LLM技术，包括位于田纳西州纳什维尔的范德堡大学，该大学为某些课程的学生提供了ChatGPT的付费版本，包括专用的插件工具。上海华东师范大学的研究人员创建了一个专门的教育LLM，名为EduChat，它结合了文章评估、基于对话的辅导和情感支持，这一切都融入了一个聊天机器人中。该团队已将该工具共享为开源代码。尽管EduChat仍处于早期阶段，但值得注意的是，它是一个专门的教育LLM，而不是现有通用模型（如ChatGPT或Bard）的改编。

是否会广泛采用？

在教育中使用人工智能引发了一个重要问题，即谁能够获得访问权，以及像 Khanmigo 这样的付费服务是否会加剧教育资源上的不平等。迪塞博表示，Khan Academy 目前正在寻找慈善家和资助来支付计算能力，并为资源匮乏的学校提供访问机会，试点阶段已将这些学校置于优先考虑之列。她强调： “我们正在努力确保数字鸿沟不会加剧。 ”

另一个挑战是如何确保LLMs提供的信息不带有偏见，同时考虑来自少数群体的知识和观点。这些信息在LLMs的训练数据中往往缺失。亚利桑那州大学（ASU）研究技术副校长肖恩·达德利（Sean Dudley）表示，RAG允许ASU的LLM平台向用户提供答案的信息源。虽然这并不能完全解决偏见问题，但他希望至少能提供透明度，并给学生一个批判性思考信息来源的机会。达德利表示：“我们的使命之一是审视那些被忽视的人。”

LLMs在教育中的潜力是否最终能够抵消风险仍不清楚。林奇承认它们是强大的工具，但也强调需要关注它们的不足之处。他说：“这不是一夜之间我们就可以飞翔的事情。”

他将LLMs引起的关注比作以前大规模在线开放课程和被称为“元宇宙”的3D虚拟世界在教育领域曾经受到的关注。虽然它们都没有一度预测的那种彻底改变力，但它们各自有其用途。他说：“从某种意义上说，这将是一样的。它不是完全坏事，也不是完美的，也不是一切，它是一种新事物。”

塔威尔在联合国教科文组织工作了二十多年，他表示，了解人工智能的局限性至关重要。与此同时，LLMs已经与人类活动紧密相连，因此有必要重新思考如何教授和评估学习。他说：“这正在重新定义我们作为人类的特质，以及我们智力的独特之处。”

原文链接：https://www.nature.com/articles/d41586-023-03507-3

往期推荐

可汗学院创始人：应该给全球每个学生提供一个人工智能助教

版权声明：
作者：小火箭
链接：https://www.xiaohuojian6.top/348.html
来源：小火箭官网
文章版权归作者所有，未经允许请勿转载。

THE END

小火箭小火箭下载小火箭加速小火箭加速器小火箭官网小火箭节点

二维码

微软推出自家人工智能芯片挑战Nvidia的市场主导地位

< <上一篇

李彦宏不断开发大模型是资源浪费

下一篇>>

搜索内容

ChatGPT进入教室LLMs如何改革教育

取消回复

共有 0 条评论

小火箭节点推荐

标签

热门文章

好用的小火箭节点推荐 Shadowrocket 高速节点

ChatGPT进入教室LLMs如何改革教育

取消回复

共有 0 条评论

小火箭节点推荐

标签

热门文章

好用的小火箭节点推荐 Shadowrocket 高速节点