2025年以来,agent(智能体)成为海内外大厂高频提及的关键词,agent行业中,ai编程智能体成为重点投入的方向。openai、微软、谷歌i/o大会都有相关发布。
一位投资人对记者表示,大模型能力的整体提升和ai编程的市场需求明确存在,因此拉动编程领域率先找到pmf(product-marketfit,产品与市场契合度)。
除了大厂,cursor、windsurf、poolside、magic、lovable、bolt.new等创业公司ai编程项目近期也被二级市场密集提及。市场需求、技术竞争、行业趋势和商业价值等多方面因素,共同推动ai编程率先在大模型时代冲出来。
海内外ai编程新品扎堆
“这一切,才刚刚开始。”微软ceo纳德拉在大会上披露,github已拥有超过1.5亿开发者,githubcopilot用户数也突破了1500万,visualstudio(微软开发的一款集成开发环境ide)系列产品用户也超过1500万。
此次,纳德拉宣布githubcopilot迈入“智能体时代”,不再是一个代码补全工具,而是一个可以独立执行开发任务的“智能编程伙伴”。开发者可以将完整任务分配给copilot,它会自动计划、执行,并提交pr(githubcopilot中的pullrequests,拉取请求)。
githubcopilot是行业开创性ai编码助手。2024年,copilot企业版面世,微软宣布内部20%-30%的代码由copilot生成。2025年,在agent浪潮中,github发布copilotagent功能,允许ai自主完成修复漏洞、重构代码等特定编程任务。
在现场,纳德拉连线openaiceo萨姆·奥尔特曼(samaltman),拆解目前ai编程与模型的发展趋势。萨姆·奥尔特曼结合openai近期发布的codex智能体产品称:当下编程领域的变革之一。用户可以拥有一个真正的虚拟员工,可以向它分配工作,处理更复杂的任务。这种能力与github深度整合,如果对其授权访问代码库和环境的权限,智能体就能完成非常了不起的工作。
在昨晚的i/o大会上,谷歌也发布多款编程领域新品与技术升级:gemini2.5propreview(i/o版)在编码和构建交互式web应用方面能力提升,在前端与ui开发上能生成精确、美观且功能完整的前端代码,支持现代web框架,可构建好看且好用的网页应用;在代码转换与编辑方面,能够将一种编程语言的代码无缝转换为另一种语言,并优化现有代码逻辑。
另外,由gemini2.5pro驱动的ai代理jules也正式发布,jules可以自主读取和生成代码。用户可将其直接集成到现有代码库中,它会在谷歌云虚拟机中克隆用户的代码库以理解项目上下文,进而执行编写测试、构建新功能、修复漏洞等任务。jules异步运行,完成任务后会呈现计划、推理过程和所做更改的差异。
除了近两天大会内容披露的ai编程工具,美国初创软件设计公司figma发布类似lovable的ai编程功能figmamake。国内大厂中,阿里云基于自研qwen3模型打造通义灵码,通过mcp工具生态支持开发者自定义工具链,目前魔搭社区已有近3000个mcp可供使用。字节跳动推出ai编程工具trae,是国内首个ai原生ide(ai原生集成开发环境工具)。百度推出了文心快码,快手开发了内部自用的kwaipilot,腾讯推出ai编程工具codebuddy。
researchandmarkets调研报告显示,2024年全球生成式ai编程助手市场规模约2590万美元,预计到2030年将达到9790万美元,六年复合年增长率为24.8%,其中中国市场的复合年增长率将达到23.5%。如此明确的市场前景,成为大厂们纷纷入局的重要原因之一。
如何衡量程序员工作
“这种技术变革在历史上并不多见,但每次变革来临时,早期大胆拥抱新工具的人总能获得巨大回报。”萨姆表示。openai发布了ai编程代理工具codex智能体,并有海外消息称,openai已同意以约30亿美元价格收购ai编程助手开发商windsurf,后者是ai编程赛道明星公司cursor的直接竞品。
尽管openai也曾传出考虑直接收购cursor的消息,但遭到了拒绝。作为ai编程领域头部公司,cursor估值近年来的持续走高,推动了ai编程行业赛道的热度。这家2021年成立的公司在今年4月完成2亿美元arr(annualrecurringrevenue,年度经常性收入),cursor背后的公司anysphere公司完成9亿美元新融资,估值升至90亿美元。
这是全行业可能带来的工作效率提升带来的估值认可。普华永道预估,githubcopilot将企业构建ai应用所需时间缩短了20%至30%,同时降低企业用云成本。如软件设计公司autodesk使用githubcopilot实现编程自动化后,工作效率提高近30%。
专注于早期投资的风险投资公司wingvc合伙人zacharydewitt此前撰文谈及cursor时表示,cursor本质上是增加了ai功能的vscode(visualstudiocode,一款由微软开发的免费开源代码编辑器)的一个分支,允许程序员与他们的代码库聊天,通过自然语言生成和重构代码,甚至让agent自主完成多步骤编码任务。因此,cursor的优势在于领先的用户与数据积累,但弊端也在于依赖外部平台,以及开源模型迅速发展。
当然,仅仅是“vscode+优秀的llm(大语言模型)”不足以建立强有力的产品护城河。ai生成的代码虽然能够运行,但可能存在风格不一致、性能不稳定、冗余等问题,尤其在复杂工程中,难以处理复杂的依赖关系;数据层面,ai编程工具的性能依赖于训练数据的质量和覆盖范围,优质数据不足或不具代表性可能导致生成的代码不符合预期。
代码质量方面,虽然ai编程产品成为程序员群体重要的辅助工具,但还远未达到可以取代的地步。此前全球支付服务与金融基础设施提供商stripe创始人帕特里克·科里森(patrickcollison)和约翰·科里森(johncollison)在2025年度大会上接受现场问答时称:“我们唯一真正追踪的指标是每位工程师单位时间内的代码合并请求量,这个数据今年增长了约30%,这是个好信号,虽然它只是个间接指标。如今几乎没人手动处理代码细节,也很少有人不使用ai工具,所以我们确实不知道答案,也不认为这是正确的衡量标准。”
简单来说,目前copilot、cursor等ai编程工具已成为开发刚需,显著提升基础编码效率,大幅减少了基础编码时间,让开发者能更快推进项目。但同时也在提示行业,部分传统指标存在误导性,需警惕“数据繁荣”下质量隐患、技术能力退化等潜在风险。ai时代,企业需要重新定义开发效能的衡量标准,聚焦“有效产出”而非“速度表象”,同时重视工程师在复杂问题解决中的不可替代性。
stripe创始人的观点恰恰呼应了此前githubceo对“编程无用论”的反驳——ai不是替代编程,而是改变编程的方式,人类的逻辑思维、创造力和问题定义能力仍是技术发展的核心。