日前,一家名为Cognition的初创公司公布了首个AI软件工程师——Devin,不同于以往大模型只能协助工程师进行开发,它可以独立完成所有编程工作,只需一句指令,即可端到端地处理整个开发项目。
据该公司介绍,使用Devin进行开发,人类用户只需通过聊天机器人式的界面,用自然语言提示的方式概述项目,Devin就会按照要求完成所有工作。它首先会创建一个详细的分步计划来完成指定的任务,然后开始使用开发人员工具(Devin可以访问标准开发人员工具,包括代码编辑器、浏览器和 shell),就像人类程序员所做的一样,而速度要快得多。Devin创建一个基本的Pong-style游戏和一个网站,只需要不到20分钟。
Devin可以编写自己的代码、修复问题、测试并实时报告其进度,因此用户可以随时了解它的进展情况。如果人类用户觉得有什么地方不对劲,他们可以在聊天框中添加另一个提示,要求AI解决问题。通过这种方式,工程团队能够将一些比较简单的项目委托给Devin,从而把精力集中在更适合人类的更具创造性的任务上。
据了解,Devin解决问题的能力非常强悍,除了前述的功能外,对于它不熟悉的技术,它还会自己在网络搜索教程学习,甚至可以帮助人类训练和微调自己的AI模型。在SWE-bench基准测试中,Devin无需人类帮助,可解决13.86%的问题,相比之下,GPT-4只能解决1.74%的问题,且都需要人类提示告知要处理哪些文件。
最令人惊奇的是,Devin已经成功通过一家AI公司的面试,并且在Upwork上完成了实际工作,也就是说它已经能“抢走”一部分工程师的饭碗了。Cognition也相信,未来,Devin将能够取代人类程序员,用更快的速度去完成那些低级的编程工作。不过目前来说,Devin还处于较为初级的阶段,并没有进行公测,也只有少部分人能拿到测试资格。