努力成为工程造价信息资讯类第一门户!

帮助中心 广告联系

广西工程造价信息网-一级造价师,二级造价师,报考条件,考试科目,培训,注册-广西造价信息网

热门关键词: 

  在AI自动编程软件Devin第一时间官宣出来后,我邀请了三位程序员代表直播讨论:ShowMeBug创始人&CEO /全栈工程师/连续创业者李亚飞;联易融副总裁沉旸;技术领导力黄哲铿Mr.K先生。

  特别的是,在这次连麦讨论中,我惊奇发现,亚飞和团队其实早在去年已经做出相关探索,并研发出了1024Code这款产品。

  如果按照时间线Code几乎可以称为中国的Devin。在和亚飞的团队深度交流时,他们认为1024Code的产品功能和内测效果可以称得上国内“第一个AI自动编程软件”。当然1024Code的技术逻辑和产品思路与Devin又有所不同,后文中会做详细论述。

  1、Devin的发布是比较典型的AI在编程领域的突破。AI Agent跟过去的AI相比,与外界有一定互动能力。比如ChatGPT一开始就有聊天的功能;但类比为人,其实没有眼睛、手和脚,因此“不能干别的”。Devin现在可以跟很多工具做链接,它会自动找哪些工具比较好用,主动阅读博客,访问网站,通过不停迭代你的意图,把编程实现。

  2、整个AI最先落地的就是AI编程领域。它不需要和物理世界关联,编程领域中有Github以及后面很多运行程序,从而支持形成了闭环。从request提需求开始,到需求解决,代码合并,到最后运行,形成一个闭环。

  其实,沉旸曾经找到李亚飞,提出过一个诉求——实现Web IDE(我们会在下文分析“IDE”),很多程序员以前是在本地写程序、做文档,这里包含了编程的几个关键步骤:

  第二步,产品经理画出原型图,大家确认,团队开发。整个过程都是线下的,虽然有数字化,但可能是断点的,原始资料也可能会丢失。

  基于在线编程,比如在线设计软件、Figma等工具结合起来以后,就从需求到运行,实现了闭环。这样,AI就能培养出一个很好的工具体系。

  Kevin比较震撼地在于实现了工程闭环。就像是做软件开发,首先要定义问题,确认需求,反复交互。Devin先定义问题,确认好之后,会尝试联网读取文档,学习编程语言,用工程的方法调试和开发。整个过程复刻日常工作的流程,实现了AIGC。

  Devin的优点是没有情绪,不会犯低级错误。缺点是展现出偏工程化的思维,对产品的哲学思考欠缺,达不到产品思维。接下来,也许会产生AI产品经理这样能够解决产品哲学思考的智能体。

  下文,我把李亚飞的思路,做一个完整的梳理,希望给到更多读者启发。也希望你有任何不同意见,可以与我探讨。

  研发效能的提升以及相关技术的定制,是我们在2019年之后的工作重点。我的主要工作就是提升“工程效能”这件事。工程效能的最高境界是全自动编程,评估好人才的能力,我们从这个维度去做了一些工作。

  AI跟程序员领域怎么结合出一个新的应用?或者说如何探索AI对于开发架构的改变,我把AI编程领域的创新理解为L5级别的全自动编程探索。

  我认为这就是趋向L5级别的创新应用。去年,ShowMeBug探索出关于编程能力的全新的底层逻辑。我们制作出了1024Code这款产品。专门成立了一个小分队研究自动写代码的技术和体系。

  1024Code是采用1024PaaS(全栈自研的云端编程环境)为核心,通用大模型为基座,花费了十多个月构建一套自主决策链AIAgent(目前称为AI导师),提供了编程环境感知,代码编辑,Shell、Console的自主阅读,运行与自主Debug。简单来说,就是将AIAgent安装了手与脚,让其自主完成需求分析到编码调试的过程。

  在这个工作体系之外,我看到的方向是自研一套云上最好用的IDE。因为你掌握了核心技术,后面才能跑得更快、更远。实际上,融资几千万之后,我们一直在规划这个核心引擎。

  L1是取代一定搜索能力的AI搜索。智能化搜索体现为信息整合检索的能力,尚不能支持对人类的启发。

  从L3开始,AI能够替代50%人类的工作,用自动化的方式完成任务。L3以上级别的自动化程度就可以解放出人类,人类就可以干别的工作了。

  Devin在替代工程师而不是产品经理的事情上,能够做得很好。软件领域的特殊性会使之在AI里面能够发挥巨大的作用。软件工程是客观的,这意味着每一步的探索都有正确答案,像是做数学题。软件中的每一个步骤,可以一步步验证是对还是错。

  Devin最大的缺点在于他还是一个预览版本。一个公司的CTO朋友曾经在第一时间觉得Devin是1024Code的翻版。Devin的交互思路体系和我们很接近。今天我们对AI编码的畅想肯定能够实现,关键是什么时候实现。

  如果硬说Devin的第二个缺点,现在AI大模型底座能力还不够强,Devin SWE-bench测试(解决指定2000个问题)13%的通过指标,还是偏弱。

  1024Code也能做到这个程度,但我们认为这不是一个高标准,所以去年1024Code做出来后,没好意思去做专门的发布。

  此外,我还发现一个核心的问题,不管你(Devin这些应用层Agent)怎么努力,其实只是在大模型之上加入了一套特别复杂的决策链(类似现在最流行的ReAct决策链)。但最终可能会发现这些都是无用功,等到后面大模型升级,从普通人变成聪明人,这些将不再需求。所以更关键的是给AI软件装上手和脚。什么是手和脚?

  1024Code现在是公测邀请阶段,虽然是邀请制(有邀请码才能注册),但我们也没限制的那么死。只要是有一定经验的软件工程师去申请获取邀请码我们就会给,然后就可以去体验功能。

  更多是让大家感受AI自主编程的能力,1024Code的目标是设计成L5级别自主编程能力的AI编程软件,在实现里,也是有一套决策链,会去分析项目/程序代码的语义语法结构,压缩信息(一些大模型的上下文是有限的),决策修改或者添加哪些文件,然后再进入到具体的更新代码动作里。

  传统的大模型助手模型下,生成代码,需要你自己找地方写入,比较费劲。1024Code基于CDE可以做到自主去定位修改文件,并在CDE编辑器内完成修改。

  这里面的决策链还是比较复杂的,但实际上我们已经给大模型加上了手和脚,比起本地IDE更有竞争力。

  我的思考逻辑是——一定会诞生一种人类与AI更友好的交互方式。比如1024Code,我们更认为人类要审批,人类可以直接改代码,AI也可以改它自己的代码。

  随着时间的推移,大家也逐步意识到,只是把IDE搬到云端并不会被用户简单接受,而是需要全新思考与设计。22年底,随着Gitpod拿到2500万美元的A轮融资,整个市场进入了全新的元年,重新把云端IDE定义为CDE(CloudDevelopmentEnvironment),我认为这个词总结得特别好,所以以下我们将原本用「云端IDE」但更合适用「CDE」的地方,统称为CDE。

  Coder是一个先从开源出发(code-server),允许开发者用VSCode连接到任意的远程服务器,进而演化出来完整的CDE(coder)环境的发展模式。也是开发者生态经典的发育模式。其核心定位是为开发者提供云端的资源配置管理、复用,开发者仍然可以复用本地开发环境。目标画像是在实际开发工作场景的开发者。

  能感受到他们更加懂开发者,Gitpod的定位也是为开发者提供生产力工具,替代本地开发。目前增长比较明显,很多开源项目的托管平台选择都有他们的影子。目标画像:在实际开发工作场景的开发者。

  AI理解数字世界或者软件的过程要靠RPA或者API。但在API方面,国内软件发展的进程并不太友好。国内产品在标准接口和标准文档上有缺陷。国内很难顺利地把两个系统对接起来。按理说简单粗糙的策划工作应该是AI完成,现在AI在做一些比较高级的工作,人类再完成前后较为低级的体力活。

  超级程序员的出现,以及企业数字化转型的场景,可能是AI编程自动化带来的结果。后者生态如果爆发,对程序员的需求反而会越来越大。

  凡本网内容请注明来源:T媒体()”的所有原创作品,版权均属于易信视界(北京)信息科技有限公司所有,未经本网书面授权,不得转载、摘编或以其它方式使用上述作品。

  本网书面授权使用作品的,应在授权范围内使用,并按双方协议注明作品来源。违反上述声明者,易信视界(北京)信息科技有限公司将追究其相关法律责任。

推荐阅读

免责声明

本网转载作品的目的在于传递更多信息,涉及作品内容、

版权等问题,请联系我们进行修改或删除!