AI软件工程师Devin横空出世程序猿的饭碗还保得住吗

“
Cognition实验室打造的全球首个由认知构建的人工智能软件工程师Devin,以其独立完成整个软件项目的承诺引起轰动。其在SWE-Bench基准测试中的表现引人瞩目,揭示了AI在软件开发领域的潜力。Devin不仅是技术突破,更是引领软件工程进入新时代的先驱。
Cognition 实验室打造的全球首个由认知打造的人工智能软件工程师,Devin,正在互联网上引起巨大轰动。该公司以来自投资者的2100万美元资金支持而备受瞩目,其中包括来自彼得·蒂尔(Peter Thiel)创始人基金的支持。Devin被誉为英文中的“神一般”,因其承诺可以独立完成整个软件项目的开发而备受关注。
尽管像GitHub Copilot等AI辅助编码工具已经越来越受欢迎,但Devin以其承诺能够独立完成整个开发项目而脱颖而出。这一潜在成功可能对软件开发行业产生深远影响,甚至可能减少对人类开发者的需求。
据悉,该公司在SWE-Bench(注:SWE-bench是一个测试系统自动解决GitHub问题能力的数据集。)基准测试中取得了13.86%的准确率,该测试评估了AI模型在软件工程任务上的性能。尽管Devin的解决率为13.86%,并不突出,但显著优于该基准测试中其他语言模型的表现,包括GPT-4。然而,需要指出的是,该基准测试尚未考虑到新模型如Claude 3或GPT-4 Turbo等的影响。这一进展标志着AI在自主理解和解决软件开发问题方面取得了显著进步,增强了其支持开发者的潜力。

据了解,Devin可能基于GPT-4 Turbo或Claude 3,并且在后台运行着多个AI代理。这种自动化在GPT 3.5中已经存在,但Cognition似乎已经精心设计了这一概念,并且极其注重用户友好的界面。
早期体验过这一全球首个人工智能软件工程师的开发者安德鲁·基恩·高表示:“Devin首先考虑的是UI/UX,而不是通用人工智能。”他表示,人工智能是核心组件,但Cognition建立的周边基础设施才是整个产品的亮点。
他说,这个产品感觉相当成熟,这不仅仅是一个演示。他补充说:“他们已经构建了一些功能,比如自动部署到Netlify,API密钥保护,智能的中断方式而不会打断,一个适合人类的良好UI,以及连接LLM和人类开发的滑块以向后移动的时间”,并表示观察这些功能的展开是很有趣的。
然而,他也指出了一个问题:“最大的问题是速度慢。”他描述网站感觉有点慢。然而,他表示这也可能是因为自己的网络问题。
这一令人印象深刻的能力飞跃引发了社交媒体上关于编程工作未来和人工智能在软件开发中的作用的辩论。一些开发者表达了对工作被取代的担忧,而其他人则将Devin视为增加生产力并专注于更高层次任务的工具。
令人惊讶的是,开发人员工作的总体前景仍然积极。据美国劳工统计局预计,从2019年到2029年,软件开发人员的就业将增长22%,远远快于所有职业的平均水平。
人工智能科学家Saurabh Shukla强调了Devin的积极面,以及它将不会取代软件工程师工作的方式:“最大的好消息是针对非技术型企业家。像Devin这样的人工智能系统将降低非技术型创始人进入技术领域的门槛。它将使软件工程民主化。”
谷歌工程经理Vineet Joglekar表示,Devin尚未准备好完全取代所有开发人员的工作,因为仍然需要手动监视故障排除、战略思考和人类驱动的创新问题解决。
Cognition在其简介中表示:“我们是一个专注于推理的应用AI实验室,代码只是一个开始。”通过提高AI的推理能力,Cognition相信它可以在各个学科中开辟新的可能性,并帮助世界各地的人们将他们的想法变成现实。


共有 0 条评论