咨询热线

400-007-6266

010-86223221

国产应用初显峥嵘 我国AI编程行业正迎来“百模大战” 产品仍有优化空间

前言:

近两年,ChatGPT、Midjourney等AI工具的出现,AI编程产品的基座也将进一步优化。目前,海外已涌现多款AI编程应用跑通商业闭环,国产AI编程应用初显峥嵘,行业正在迎来“百模大战”。而随着AI编程工具快速进化,部分科技公司放缓程序员招聘进程。不过,以当前的AI技术来说,AI编程有三大难关要过,产品仍有优化空间。

1、大模型进入推理时代,AI编程产品的基座也将进一步优化

编写代码、理解代码及互联网搜索、调试、写注释、测试等工作是软件开发者的最高频、最耗时的工作需求,随着生成式AI底层能力提升,开发者普遍开始借助AI解决项目问题。AI代码生成工具可赋能软件开发的全生命周期,帮助程序员提高工作效率、减少错误、优化代码质量,并加速软件的交付和迭代。

根据观研报告网发布的《中国AI编程行业现状深度研究与发展趋势分析报告(2025-2032年)》显示,近两年,ChatGPT、Midjourney等AI工具的出现,AI代码工具也随之出现。根据2024年9月,OpenAI发布o1-preview与o1-mini,大模型技术发展进入预训练放缓而后训练加速的阶段,模型厂商更重视思维链(CoT)的延长、强化学习算法的创新、以及通过算法优化降低推理成本。例如,2025年1月20日发布的DeepSeek R1-Zero,是首个通过纯强化学习(RL)训练且无需任何监督微调(SFT)数据的模型,该模型根据环境反馈的奖励信号来调整自身策略,探索如何更好地完成任务,验证了强化学习Scaling在模型训练中的潜力。

基础大模型厂商陆续推出“推理模型”版本

发布时间

公司名称

模型名称

总结

2024/9/13

OpenAI

o1-preview/ o1-mini

o1-preview在物理、化学和生物学方面具有挑战性的基准任务上的表现超过人类博士生水平;o1-mini价格比o1-preview便宜80%,在成本方面有较大优势。

2024/10/22

Anthropic

Claude -3.5- sonnet更新版

编码能力大幅提升,新的“computercontrol”功能,使Claude能够像人类一样与计算机进行交互:查看屏幕、控制光标、单击和打字。

2024/12/6

OpenAI

o1正式版

o1正式版,比o1-preview更擅长编码、数学和写作,新增多模态功能,o1现在支持图片上传,允许它将推理应用于视觉,以获得更详细、更有用的回复更智能。

2024/12/11

谷歌

Gemini2.0 Flash Thinking

基于Gemini2.0Flash模型,在处理复杂问题时,能够模仿人类逐步推理的过程,在多模态理解、推理和编码方面表现出色,可解决编程、数学、物理等领域的复杂问题。在codemath能力方面比Gemini1.5pro有所提升。

2025/1/15

科大讯飞

讯飞星火深度推理模型X1

星火X1成为国内唯一采用全国产算力平台、率先落地到真实应用场景的深度推理模型,并在教育、医疗等领域展现出优势。

2025/1/20

月之暗面

Kimi1.5

short-CoT模式下,Kimik1.5的数学、代码、视觉多模态和通用能力,大幅超越了全球范围内短思考SOTA模型GPT-4oClaude3.5Sonnet的水平,领先达到550%;而在long-CoT模式下,Kimik1.5的数学、代码、多模态推理能力,也达到长思考SOTA模型OpenAIo1正式版的水平。

2025/1/20

深度求索

Deep SeekR1

在问题解决能力上与OpenAIo1模型相当,但成本显著更低。

2025/1/29

阿里巴巴

Qwen2.5-Max

Qwen2.5-Max11项基准测试中优于DeepSeekV3MetaLlama3.1

2025/2/1

OpenAI

o3mini

o3-minio1-mini响应速度提升24%,答案准确性也有所提高

资料来源:观研天下整理

推理性能的提升,也带来模型的数学、编码、逻辑能力提升,AI编程产品的基座也将进一步优化。尤其是最近,美国AI独角兽公司Anthropic发布新升级的大模型Claude4系列,包含Claude Opus 4和Claude Sonnet 4,特点是编程时长和理解能力突出,尤其是Claude Opus 4能持续编写代码7小时,被称为“全球不用手动修改”便能生成高质量代码的大模型。

2、AI编程行业正在迎来“百模大战”

当前,市面上活跃的AI编程工具已是“百花齐放”。例如,海外已涌现多款AI编程应用跑通商业闭环,获得明星资本和科技巨头客户认可,充分验证AI编程市场潜力,包括Copilot、Agent2种形态,其中Copilot代表如GitHub Copilot、Cursor等,能够实现代码补齐优化等功能,收费数十美元/月,Agent以CognitionDevin为代表,可独立完成代码开发等复杂任务,收费500美元/月。在国内市场,国产AI编程应用初显峥嵘,如2024年6月,字节跳动发布基于豆包大模型打造的智能开发工具-豆包MarsCode,在国内免费开放。

国内外知名AI编程工具

产品

所属公司

期末声量值

3MAU()

存在形式

Kimi-AI编程助手

月之暗面

77993

3475.25

WEB+APP

Cursor

Anysphere

22316

1243.7

IDE插件+WEB

Trae

字节

5390

307.04

IDE插件

Kite

Kite

4915

/

IDE插件

GitHub Copilot

微软

3094

/

IDE插件

通义灵码

阿里

2087

33.44

云服务平台+IDE插件+开源模型与企业级部署

Windsurf

Windsurf

1238

61.12

IDE插件

文心快码

百度

1187

28.41

Code插件

CodeGeeX

智谱AI

856

/

WEB

Code Whisperer

亚马逊

230

/

IDE插件

资料来源:观研天下整理

面对诸多AI编程工具,企业该如何选择呢?可以从技术和功能两大维度衡量:一是,AI编程工具的技术依赖于背后的大模型能力。根据业内人士表示,AI编程的底层技术原理是大语言模型+代码特定的训练优化,国内比较适配AI编程的大模型有DeepSeek和Qwen系列,国外为Claude、Gemini、GPT4,目前Claude系列模型因其代码理解与长文本处理能力被认为最适配AI编程。

二是,处理复杂开发流程的能力,比如能否理解多个代码文件、修复bug、生成前端界面、根据UI图片识别生成代码,以及能否自主调用工具、操作系统命令等方面的能力,如果能自动处理的流程越多、越流畅,这说明该AI编程工具水平越强。

3、AI编程工具快速进化,部分科技公司放缓程序员招聘进程

而对于程序员来说,AI编程工具快速进化,让其感受到就业危机。例如,自2024年下半年以来,海外科技厂商陆续发布裁员或减缓招聘的公告,尤其针对初、中级程序员进行了优化。而在2025年5月13日,微软宣布在全球进行一场牵涉6000名员工的大裁员,众多岗位中,程序员首当其冲。有报道,微软华盛顿州被裁的2000人中有41%左右与软件工程类岗位相关,其中不乏像TypeScript编译器核心开发者Ron Buckton这样的资深工程师。

2025年各大科技公司放缓程序员招聘进程

时间

公司

新闻内容

2024824

IBM

IBM中国研发部门程序员被裁,或转向自动化和人工智能驱动

20241218

Salesforce

2025Salesforce将不再招聘软件工程师,因为2024年通过Agentforce和用于工程团队的其他AI技术将生产力提高了30%以上

2025115

Meta

Meta计划裁员约5%绩效较低员工,扎克伯格表示AI或将取代中级码农职位,最终可能会将其应用程序的所有编程工作外包给AI

202518

微软

微软将“很快”在公司范围内裁员,重点关注包括安全部门在内的各个岗位上表现不佳的员工

资料来源:观研天下整理

4、AI编程有三大难关要过,产品仍有优化空间

不过,以当前的AI技术来说,AI编程更像是一位高效的助手,而不是程序员的完全替代者。如果想要完全取代程序员,AI编程至少还有三关要过:

AI编程行业面临的困境

<strong>A</strong><strong>I</strong><strong>编程行业面临的困境</strong>

资料来源:观研天下整理

此外,AI编程产品仍有优化空间,主要体现在“技术+产品”方面。例如,技术方面,AI编程需要沿着强化学习Scaling的方向继续前进,进一步优化训练数据和算法,提高代码的准确性和可靠性;产品方面,面对垂直领域与复杂业务流程,AI编程工具需要更多结合行业与工作流know-how。

AI编程的优势与局限性

功能分类

描述

应用场景

优点

缺点

代码补全

生成代码片段或建议,帮助完成当前编写的代码行

编写代码时自动补全函数调用、变量声明

提高编码速度,减少打字量

生成不完全符合上下文的代码

代码生成

根据描述或模型输入生成完整的代码片段或函数

根据业务逻辑描述生成特定功能的代码

加快开发流程,减少手动编写复杂代码的需求

生成的代码可能需要调整以满足特定需求

代码重构

自动识别代码中的改进点并提出重构建议

优化现有代码库,提高代码质量

提升代码可维护性和性能

重构建议可能不完全准确,需要人工审核

测试用例生成

生成测试用例和测试脚本

自动化测试,确保代码质量

减少测试用例编写工作,提高测试覆盖率

生成的测试用例可能需要根据实际情况调整

代码审查辅助

分析代码并提供改进建议

代码审查阶段,提高代码质量

帮助发现潜在问题,促进团队遵循最佳实践

可能产生误报,需要开发者判断

代码搜索与导航

根据自然语言查询提供代码定位和搜索结果

快速定位和理解大型代码库中的特定部分

提高代码理解和导航效率

搜索结果的准确性可能受限于索引和算法

交互式编程

通过自然语言与AI进行对话,获取编程帮助

解决编程问题,学习新技术

提供即时的编程指导和解决方案

可能无法理解复杂的编程问题或上下文

资料来源:观研天下整理(WYD

更多好文每日分享,欢迎关注公众号

【版权提示】观研报告网倡导尊重与保护知识产权。未经许可,任何人不得复制、转载、或以其他方式使用本网站的内容。如发现本站文章存在版权问题,烦请提供版权疑问、身份证明、版权证明、联系方式等发邮件至kf@chinabaogao.com,我们将及时沟通与处理。

BC端共赴新蓝海 我国字库行业扩容 双寡头格局稳固 数字、个性、专业化趋势显著

BC端共赴新蓝海 我国字库行业扩容 双寡头格局稳固 数字、个性、专业化趋势显著

我国字库行业梯队化竞争格局明显。其中,汉仪字库、方正字库凭借优势的服务及丰富的行业经验,处于字库行业第一梯队,总市占率高达 75%。第二、三梯队企业规模较小,总市占率仅为25%,汉仪字库、方正字库双寡头地位稳固。

2025年05月31日
国产应用初显峥嵘 我国AI编程行业正迎来“百模大战” 产品仍有优化空间

国产应用初显峥嵘 我国AI编程行业正迎来“百模大战” 产品仍有优化空间

此外,AI编程产品仍有优化空间,主要体现在“技术+产品”方面。例如,技术方面,AI编程需要沿着强化学习Scaling的方向继续前进,进一步优化训练数据和算法,提高代码的准确性和可靠性;产品方面,面对垂直领域与复杂业务流程,AI编程工具需要更多结合行业与工作流know-how。

2025年05月30日
中国高速视觉行业增速快于全球 外企占主导 中科视界突围 美国出口管制下国产替代强化

中国高速视觉行业增速快于全球 外企占主导 中科视界突围 美国出口管制下国产替代强化

高速视觉行业进入中国仅20年的时间,属于具有代表性的战略新兴产业,由于存在技术壁垒,头部企业主要为海外品牌,国内企业多通过与国际高速摄像机龙头建立合作关系,成为其承销商来进入市场,具备自主研发能力的企业较少,包括中科视界、深视智能等。其中,中科视界近年发展迅猛,已成为高速视觉领域头部企业。

2025年05月25日
我国电脑操作系统行业:国产厂商正崭露头角 鸿蒙系统填补技术空白实现自主可控

我国电脑操作系统行业:国产厂商正崭露头角 鸿蒙系统填补技术空白实现自主可控

目前我国已有一批优秀的国产操作系统成功实现自主研发与生产,并逐步进入规模化应用阶段,且相关产品的安全性、稳定性均已实现跨越式发展,正加速从“能用”迈向“好用”,打破了海外厂商垄断格局。据流量监测公司StatCounter统计显示,Windows操作系统在中国的市场占有率已从2020年的87.09%下滑至2023年的80

2025年05月23日
我国网络安全硬件行业规模达百亿级 产品更新需求下头部优势企业将占据更多份额

我国网络安全硬件行业规模达百亿级 产品更新需求下头部优势企业将占据更多份额

近年来,我国对网络安全的重视程度不断提升,推动了网络安全行业的快速发展。作为保障网络安全的重要基石,网络安全硬件也迎来增长机遇,市场规模达百亿级。全球经济下行带来新安全需求,我国网络安全硬件开始与更多的新技术如AI、云计算、大数据等相结合,持续推出新产品以提高网络安全防护的效率和准确性。目前来看,下一代AI防火墙、零信

2025年05月22日
B端落地+C端渗透拉动我国商业大数据服务行业空间持续扩大  B端市场竞争更激烈

B端落地+C端渗透拉动我国商业大数据服务行业空间持续扩大 B端市场竞争更激烈

技术是推动商业大数据服务行业发展的核心驱动力,近年来我国智能文字识别进步,为我国商业大数据服务行业成长提供了坚实土壤。商业大数据服务可分为基础数据服务、标准化C端产品、标准化B端产品、场景化解决方案四种形式。未来,在B端应用的持续落地及C端市场的不断渗透背景下,我国商业大数据服务需求有望进一步释放,拉动市场空间持续增长

2025年05月12日
微信客服
微信客服二维码
微信扫码咨询客服
QQ客服
电话客服

咨询热线

400-007-6266
010-86223221
返回顶部