咨询热线

400-007-6266

010-86223221

数据大量浪费下数据标注行业受国家重点关注 企业积极布局但仍面临人才短缺困境

前言:

我国是数据大国,但不是数据资源强国,数据留存率远低于发达国家水平。数据的大量浪费制约了我国数据资源价值的发挥,在此背景下,数据标注行业发展受到国家重点关注。海天瑞声、格灵深瞳、云天励飞、博彦科技等A股上市公司正围绕政策要求及市场需求,积极布局数据标注相关产业。未来随着专业人才短缺问题得以解决,我国数据标注行业发展有望迈上新台阶。

、数据大量浪费情况严重,数据标注行业发展受到国家重点关注

2025年1月13日,国家发展改革委、国家数据局、财政部、人力资源社会保障部四部门联合发布《关于促进数据标注产业高质量发展的实施意见》。《意见》强调,到2027年,数据标注产业专业化、智能化及科技创新能力显著提升,产业规模大幅跃升,年均复合增长率超过20%。

在上述政策发布以前,国家已多次出台相关政策推动数据标注行业发展。如《关于加快建设全国统一大市场的意见》提出加快培育数据要素市场,建立健全数据安全、权利保护、跨境传输管理、交易流通、开放共享、安全认证等基础制度和标准规范,深入开展数据资源调查,推动数据资源开发利用。《“数据要素×”三年行动计划(2024-2026年)》指出选取工业制造、现代农业、商贸流通、交通运输、金融服务、科技创新、文化旅游、医疗健康、应急管理、气象服务、城市治理、绿色低碳等12个行业和领域,推动发挥数据要素乘数效应,释放数据要素价值。

我国数据标注行业相关政策

时间 政策 发布部门 主要内容
2022.01 《“十四五”数字经济发展规划》 国务院 充分发挥数据要素作用,强化高质量数据要素供给,提升数据管理水平和数据质量。加快数据要素市场化流通,鼓励市场主体探索数据资产定价机制。严历打击数据黑市交易,营造安全有序的市场环境。以实际应用需求为导向,探索建立多样化的数据开发利用机制。
2022.04 《关于加快建设全国统一大市场的意见》 中共中央、国务院 加快培育数据要素市场,建立健全数据安全、权利保护、跨境传输管理、交易流通、开放共享、安全认证等基础制度和标准规范,深入开展数据资源调查,推动数据资源开发利用。
2022.06 《关于构建数据基础制度更好发挥数据要素作用的意见》 国务院 建立数据产权制度,推进公共数据、企业据、个人数据分类分级确权授权使用,建立数据资源持有权数据加工使用权、数据产品经营权等分置的产权运行机制,健全数据要素权益保护制度。
2023.12 《数据经济促进共同富裕实施方案》 国家发展改革委、国家数据局 旨在利用数字技术推动经济发展,缩小地区、城乡、群体和公共服务之间的差距,实现共同富裕。到2025年,预期在缩小差距方面取得积极进展,并在2030年取得显著成效。
2023.12 《深入实施“东数西算”工程加快构建全国一体化算力网的实施意见》 国家发展改革委、国家数据局等五部门 差异化统筹布局行业特征突出的数据集群,促进行业数据要素有序流通,打造一批涵盖算力利用与数据开发的行业数据应用空间,服务行业大模型的基础实验及商业化应用。推动各级各类数据流通交易平台利用国家枢纽节点算力资源开展数据流通应用服务,促进数据要素关键信息登记上链、存证备份、追溯溯源。
2024.01 《“数据要素X”三年行动计划(2024-2026年)》 国家数据局等17部门 《行动计划》选取工业制造、现代农业、商贸流通、交通运输、金融服务、科技创新、文化旅游、医疗健康、应急管理、气象服务、城市治理、绿色低碳等12个行业和领域,推动发挥数据要素乘数效应,释放数据要素价值。

资料来源:观研天下整理

数据标注产业的发展受到国家的重点关注,主要由于数据的大量浪费制约了我国数据资源价值的发挥。伴随着数字中国建设的推进,我国数字经济迈向了全面扩展期,数据成为了新的生产要素。通用人工智能的发展更进一步催生海量数据,2023年我国数据生产总量超32ZB。我国是数据大国,但不是数据资源强国,2023年保存数据仅有2.9%,数据留存率远低于发达国家水平。

数据标注产业的发展受到国家的重点关注,主要由于数据的大量浪费制约了我国数据资源价值的发挥。伴随着数字中国建设的推进,我国数字经济迈向了全面扩展期,数据成为了新的生产要素。通用人工智能的发展更进一步催生海量数据,2023年我国数据生产总量超32ZB。我国是数据大国,但不是数据资源强国,2023年保存数据仅有2.9%,数据留存率远低于发达国家水平。

数据来源:观研天下数据中心整理

、我国数据标注市场规模持续增长,目前数据资源定制服务为主

观研报告网发布的《中国数据标注行业现状深度分析与发展前景预测报告(2025-2032年)》显示,2021-2024年我国数据标注市场规模已由43.3亿元增长至77.3亿元,在政策推动下,我国数据标注市场规模将进一步增长,预计至2027年超150亿元,至2029年超200亿元。

2021-2024年我国数据标注市场规模已由43.3亿元增长至77.3亿元,在政策推动下,我国数据标注市场规模将进一步增长,预计至2027年超150亿元,至2029年超200亿元。

数据来源:观研天下数据中心整理

从细分市场结构看,我国数据标注以数据资源定制服务为主,占比约为85%,标准化数据集产品占比较小,约为13%。

从细分市场结构看,我国数据标注以数据资源定制服务为主,占比约为85%,标准化数据集产品占比较小,约为13%。

数据来源:观研天下数据中心整理

相关企业积极布局数据标注核心技术攻关速度有望加快

数据标注是数字经济发展的基础性、战略性产业,为培育和壮大市场主体,国家鼓励企业加快科技创新投入;重点布局跨语言、跨领域、跨模态语义对齐、4D标注、大模型标注、数据合成等标注核心技术攻关项目;支持研发专家标注、多模态标注、众包标注、标注审查、质量评估等智能化高端化工具,提升数据标注科技水平。

截至目前,海天瑞声、格灵深瞳、云天励飞、博彦科技等A股上市公司正围绕政策要求及市场需求,积极布局数据标注相关产业。如在4D数据标注领域,海天瑞声通过在自动驾驶领域用于标注车辆、行人、交通标志等物体在不同时刻的位置和运动状态,帮助自动驾驶系统理解道路场景的动态变化,提升自动驾驶系统的感知能力等。

我国数据标注行业相关企业布局情况

企业名称 布局情况
海天瑞声 2023年5月,海天瑞声发布了全新升级的智能驾驶数据处理平台DOTS-AD,具备3D点云语义分割、BEV、300万大点云以及4D标注等前沿数据标注能力,并不断优化算法中台中枢能力,引入最新SAM开源模型,提升2D语义分割项目中的降本增效能力。在大模型数据服务业务方面,公司与国内众多知名大模型厂商合作,业务范围覆盖RLHF数据评分、Prompt改写、人机多轮交互等强化学习阶段数据需求,并发布了首个大语言模型预训练数据集DOTS-NLP-216。公司通过前瞻性研究,探索拓展大模型相关数据服务范围及服务能力,提升大模型数据的规模化生产效率。
格灵深瞳 公司利用自研的底层AI技术平台深瞳大脑对数十亿训练数据进行清洗,并训练大规模数据基础模型,在海量数据下,研发了基于多模态弱监督的大模型训练算法,节省了大量数据标注资源。公司自研的海量数据算法生产技术通过自有的核心算法结合大数据平台的分析处理技术,支持在海量数据中进行挖掘,主动触发模型更新训练,有效的提高了算法的准确率和生产率。同时,公司自建的数据标注平台,通过组建具有专业背景的标注团队,用人工标注加AI模型自动化预识别的方法,为算法提供精准的基础训练数据,可覆盖公司内部99%的算法标注任务。
云天励飞 公司自研大规模训练及部署技术,旨在于打通从数据底座、数据标注、模型训练、模型部署、模型评测等从数据到模型生产的全链条,用于公司内部技术沉淀、降本增效以及外部长尾算法的生产。目前已经形成了智能自研数据标注系统、可标准化高效生产算法的YMIR平台、支持分布式的模型部署平台以及自动化模型评测平台。
博彦科技 博彦科技依托自身强大的研发与创新能力,广泛采用基于大数据、人工智能和云计算等新兴技术,搭建了人工智能计算平台,拥有涵盖样本标注、模型部署、模型训练和模型推理服务的一站式AI开发能力,可协助金融、互联网和制造等行业用户快速进行模型训练和部署,管理全周期AI工作流程,降低模型开发门槛,并协助研发人员迅速推出AI模型服务。

资料来源:观研天下整理

我国数据标注行业仍面临挑战,专业人才短缺问题亟待解决

随着技术的进步,数据标注行业也在向知识密集型转变,这意味着对于高学历和拥有专业技能的人才的需求将会增加。数据显示,数据标注此前较少有人关注,当ChatGPT火爆全球后,其需求量大幅增长,2023年增速达34.43%。从行业分布来看,数据标注新发职位主要集中于互联网、计算机软件、人工智能三大行业,占比为29.65%、12.7%、9.96%。相较日益增长的市场需求,我国数据标注人才数量不足,成为制约我国数据标注行业发展的重要因素之一。

未来,通过加强职业教育和培训体系建设,支持高校和职业院校开设数据标注相关专业和课程;推动企业与教育机构合作,共建实训基地和培训中心,培养具备专业技能和职业素养的数据标注人才;制定吸引和留住高层次人才的政策措施,促进数据标注领域的国际交流与人才合作,我国数据标注专业人才短缺的情况将得到缓解,行业发展也有望迈上新台阶。

未来,通过加强职业教育和培训体系建设,支持高校和职业院校开设数据标注相关专业和课程;推动企业与教育机构合作,共建实训基地和培训中心,培养具备专业技能和职业素养的数据标注人才;制定吸引和留住高层次人才的政策措施,促进数据标注领域的国际交流与人才合作,我国数据标注专业人才短缺的情况将得到缓解,行业发展也有望迈上新台阶。

数据来源:观研天下数据中心整理(zlj)

更多好文每日分享,欢迎关注公众号

【版权提示】观研报告网倡导尊重与保护知识产权。未经许可,任何人不得复制、转载、或以其他方式使用本网站的内容。如发现本站文章存在版权问题,烦请提供版权疑问、身份证明、版权证明、联系方式等发邮件至kf@chinabaogao.com,我们将及时沟通与处理。

高可靠性存储需求驱动 全球SLC NAND行业开启黄金时代 国产替代迎新风口

高可靠性存储需求驱动 全球SLC NAND行业开启黄金时代 国产替代迎新风口

全球SLC NAND市场份额高度集中于海外及中国台湾厂商。根据数据,2024年全球SLC NAND前三大厂商市场份额合计占比69.4%,其中铠侠占比35.2%,美光占比23.3%,华邦占比10.9%,市场呈现高度集中格局。

2025年12月29日
AI浪潮+技术迭代加速 我国企业级SSD行业开启黄金增长新周期

AI浪潮+技术迭代加速 我国企业级SSD行业开启黄金增长新周期

当前,全球及中国企业级SSD市场正步入规模扩张与技术升级并行的快车道。一方面,存储介质由HDD向SSD的加速替代,以及PCIe接口标准的快速迭代,持续推动性能边界与成本效益的突破。另一方面,AI算力需求的爆发式增长,不仅直接催生了更大容量、更高性能的QLC SSD需求,也推动着如存储级内存(SCM)与CXL高速互联协议

2025年12月20日
AI赋能+周期共振 NAND Flash行业开启高韧性增长新阶段 国产企业正加速突围

AI赋能+周期共振 NAND Flash行业开启高韧性增长新阶段 国产企业正加速突围

当下,在AI技术爆发式发展的推动下,NAND Flash行业正稳步迈入新一轮上行周期。凭借非易失性、高密度、低成本的核心特性,NAND Flash成为AI基础设施建设、智能终端升级及数据中心扩容的关键支撑——从大模型训练所需的海量数据存储,到边缘计算设备的本地数据留存,再到消费电子的存储容量升级,全场景需求的集中释放为

2025年12月18日
国家战略与AI浪潮双轮驱动:中国超级计算行业市场进入新纪元

国家战略与AI浪潮双轮驱动:中国超级计算行业市场进入新纪元

超级计算作为利用极致算力解决复杂科学工程问题的国家重器,已从传统的科研领域演变为驱动数字经济与智能革新的核心基础设施。中国超算行业历经从技术突破(如“天河一号”问鼎世界)到生态构建的跨越式发展,已建立起覆盖全国的算力网络。当前,行业在 “东数西算”国家工程、AI大模型爆发、产业智能化转型及技术自主可控 四大核心动力驱动

2025年12月06日
顶层政策强制性驱动 我国服务器密码机行业竞争格局呈“金字塔”型

顶层政策强制性驱动 我国服务器密码机行业竞争格局呈“金字塔”型

近年来,我国服务器密码机行业蓬勃发展,其最根本、最确定的驱动力源于顶层政策与法律法规的强制性合规要求,这为行业创造了基础且持续增长的市场空间。例如,《密码法》的实施确立了商用密码的法律地位,要求关键信息基础设施必须使用商用密码进行保护,并开展安全性评估;等保2.0与关保条例明确将密码应用安全性纳入网络安全等级保护和关键

2025年12月04日
下游应用多点开花 冷链智能控制及监测记录行业高增 精创电气为细分领域龙头

下游应用多点开花 冷链智能控制及监测记录行业高增 精创电气为细分领域龙头

近年来,冷链智能控制及监测记录行业在多个领域加速渗透。在疫苗运输领域,冷链智能控制及监测记录可实现2-8℃精密控温,如辉瑞新冠疫苗采用Thermo Fisher的实时监测设备,超温立即销毁;生物样本运输领域,液氮罐配备无线传感器,监测液位和温度;社区团购领域,预冷+蓄冷箱技术实现"最后一公里"无源保温6小时,盒马鲜生使

2025年11月22日
构筑AI世界的“智能基石” 我国数据标注行业向综合竞争力加速演进

构筑AI世界的“智能基石” 我国数据标注行业向综合竞争力加速演进

当前,全球数据标注市场呈现出二元格局:欧美国家凭借技术生态与自动化工具,掌控产业链上游与高端环节;而亚太地区则依托人口红利,成为全球标注外包的主力军。在这一背景下,中国数据标注产业走出了一条独特的发展路径:在国家级战略与七大标注基地的规划引领下,依托庞大的内需市场(如自动驾驶超千万公里的数据需求),驱动产业从依赖“人海

2025年11月18日
政策、技术与需求三重驱动 我国卫星互联网发展提速 行业全链条自主可控已初步形成

政策、技术与需求三重驱动 我国卫星互联网发展提速 行业全链条自主可控已初步形成

卫星互联网是新基建的重要组成部分,近年来获得我国政府的高度重视与大力支持。国务院、工信部等国家部门及各地政府陆续出台一系列法律法规与鼓励政策,为行业持续健康发展筑牢政策支撑。如工信部发布《工业和信息化部关于组织开展卫星物联网业务商用试验的通知(征求意见稿)》,计划针对低轨卫星通信应用适时开展商用试验,实现全球范围内宽带

2025年11月18日
微信客服
微信客服二维码
微信扫码咨询客服
QQ客服
电话客服

咨询热线

400-007-6266
010-86223221
返回顶部