咨询热线

400-007-6266

010-86223221

我国数据标注行业波特五力模型分析 潜在进入者威胁比较大 竞争较为激烈

数据标注是通过数据加工人员借助标记工具,对人工智能学习数据进行加工的一种行为。通常数据标注的类型包括:图像标注、语音标注、文本标注、视频标注等种类。标记的基本形式有标注画框、3D画框、文本转录、图像打点、目标物体轮廓线等。

一、行业市场规模

近年来随着人工智能的迅速发展,数据标准产业发展也非常迅速。数据显示,2021年我国数据标准行业规模达到43.3亿元,同比增长约19.2%,预计未来仍有望保持快速增长。

近年来随着人工智能的迅速发展,数据标准产业发展也非常迅速。数据显示,2021年我国数据标准行业规模达到43.3亿元,同比增长约19.2%,预计未来仍有望保持快速增长。

资料来源:观研天下数据中心整理

二、波特五力模型分析

1、波特五力模型原理

波特五力分析模型是迈克尔·波特(Michael Porter)于20世纪80年代初提出,对企业战略制定产生全球性的深远影响。用于竞争战略的分析,可以有效的分析客户的竞争环境。

根据波特的观点,一个行业中的竞争,不止是在原有竞争对手中进行,而是存在着五种基本的竞争力量,这五种基本竞争力量的状况及综合强度,决定着行业的竞争激烈程度,从而决定着行业中最终的获利潜力以及资本向本行业的流向程度,这一切最终决定着企业保持高收益的能力。波特五力分别是:供应商的议价能力、购买者的议价能力、潜在竞争者进入的能力、替代品的替代能力、行业内竞争者现在的竞争能力。五种力量的不同组合变化,最终影响行业利润潜力变化。

波特五力分析属于外部环境分析中的微观环境分析,主要用来分析本行业的企业竞争格局以及本行业与其他行业之间的关系。本质上是一种管理思想在企业营销管理实践活动中战略层面的应用工具,要求我们的企业市场营销管理者从战略分析的角度来管理企业。强调的是种战略意识,或者说战略性思维的运用。

2、供应商议价能力

根据观研报告网发布的《中国数据标注行业发展现状调研与投资前景预测报告(2022-2029年)》显示,从数据标注代表企业业务布局来看,大部分数据标注服务商提供文本、语音、图像、视频等各类型数据标注,服务应用领域涵盖安防、智能驾驶、医疗、教育、金融等多个领域,主要客户包括科技公司、人工智能企业、传统企业、政府部门、科研机构等,由于行业内数据标注企业数量较多,客户选择范围比较大,所以客户议价能力较强。

3、购买者议价能力

从数据标注代表企业业务布局来看,大部分数据标注服务商提供文本、语音、图像、视频等各类型数据标注,服务应用领域涵盖安防、智能驾驶、医疗、教育、金融等多个领域,主要客户包括科技公司、人工智能企业、传统企业、政府部门、科研机构等,由于行业内数据标注企业数量较多,客户选择范围比较大,所以客户议价能力较强。

4、新进入者威胁

作为人工智能产业链中必不可少的一环,发展AI数据标注服务成为了各地方推进AI建设的重要方向之一,贵州、山西、重庆等地相继出台指导意见,引入科技公司,共建数据基地、数据交易中心,打造具有地方特色的人工智能产业园。

目前,众多数据标注公司自建标注基地或团队,如百度的“百度山西的AI数据标注基地”、“百度大数据百鸟河基地”,数据堂的“数据堂保定数据加工基地”、“数据堂合肥数据基地”、“数据堂北京TTS录音中心”等,多分布在山西、河南等地,可以看出,由于处于人工智能的风口上,数据标注行业受到政府、社会资本的广泛关注,行业潜在进入者的威胁比较大。

据统计截止2021年数据标准行业相关企业数达到795家。

据统计截止2021年数据标准行业相关企业数达到795家。

资料来源:观研天下数据中心整理

5、替代品威胁

对于数据标注行业而言,在当前技术条件下,行业不存在严格意义上的替代品,行业替代品的威胁十分低。

6、同业竞争程度

目前,我国国内数据标注市场第一梯队包括头部公司组建自己的数据标注部门,京东(京东众智)、百度(百度众测)、腾讯、阿里(阿里数据标注)都已经拥有自己的标注平台和工具。头部公司之外,国内近年兴起众多数据标注公司,如龙猫数据、Testin云测、倍赛BasicFinder、数据堂等。这些公司仅次于头部公司,都具有相当的规模,位于第二梯队,总体来看行业的竞争较为激烈,现有企业间竞争威胁较大。

数据标注行业集中度估算

集中度类型 市场集中度指标值(%)
CR4 16.7
CR8 21.5

资料来源:观研天下数据中心整理

三、行业发展存在的问题

1、不同的行业、不同的业务场景对数据标注的需求存在一定的差异性,现有的标注任务还不够细化, 缺乏定制化标注能力。

数据标注的应用场景十分广泛,具体来说有自动驾驶、智慧安防、新零售、AI教育、工业机器人、智慧农业等领域。

不同的应用场景对应不同的标注需求,比如自动驾驶领域主要涉及行人识别、车辆识别、红绿灯识别、道路识别等内容,而智慧安防领域则主要涉及面部识别、人脸探测、视觉搜索、人脸关键信息点提取以及车牌识别等内容,这对数据服务供应商的定制化标注能力提出了新的挑战。

2、标注效率与数据质量均较低,且欠缺人机协作能力。

数据标注行业的特殊性决定了其对于人力的高依赖性,目前主流的标注方法是标注员根据标注需求, 借助相关工具在数据上完成诸如分类、画框、注释和标记等工作。

由于标注员能力素质的参差不齐以及标注工具功能的不完善,数据服务供应商在标注效率以及数据质量上,均有所欠缺。

此外,目前很多数据服务供应商忽视或完全不具备人机协作能力,并没有意识到AI对于数据标注行业的反哺作用。

以曼孚科技标注业务为例,通过在标注过程中引入AI预标注以及在质检过程中引入AI质检,不仅可以有效提高标注效率,同时也可以极大提升标注数据集的准确度。

3、品牌数据标注服务提供商依赖众包、转包模式,造成标注结果质量的层次不齐。

现阶段,数据标注主要依靠人力来完成,人力成本占据数据标注服务企业总成本的绝大部分。因此很多品牌数据服务供应商都放弃自建标注团队,转而通过分包、转包的模式完成标注业务。

与自建标注团队相比,众包与转包的方式,成本较低且比较灵活,但是与自建标注团队相比,这两种模式信息链过长,且质量难以把控,从长远角度来看,自建标注团队更加符合行业发展的需求。

4、基于众包、转包模式下的数据标注任务会造成用户数据缺乏安全性, 并面临隐私泄露的风险。

一些特殊行业的需求方,比如金融机构和政府部门格外注重标注数据的安全性, 但是一些数据标注企业出于成本方面的考虑,会将这些敏感的数据分发、转包给其他服务商或者个人,这就带来了巨大的潜在数据泄露风险。如何建立一套完善的数据安全防护机制就成为当下诸多数据服务供应商需要着重考量的因素。

四、行业发展策略

1、细化数据标注任务

随着人工智能技术在一些行业的广泛应用,这些行业原有的数据标注任务已经不再满足业务需求。以智能安防为例,为了促进智能安防系统从传统的被动防御走向智能化的主动预警,一些新的数据标注任务也应运而生。例如,当一个神情紧张或者头戴面罩的小偷手握一根棍子准备翻越小区外墙企图实施盗窃行为时,安防系统应该马上启动报警系统,并及时向安防人员发出警告,以保障住户的财产安全。实现异常情况预警的新标注任务,包括表情标注、危险品标注和行为标注,利用这些数据标注就能帮助安防系统识别紧张的表情、违法的面罩和违规的翻越行为以及可能的凶器——棍子。从技术角度来看,新标注任务为异常行为的识别与建模提供了高质量的训练数据,也有利于提高模型训练的准确性。因此,针对特定的行业需求细化标注任务,将是今后数据标注的一个发展趋势。

2、半自动化数据标注工具的研发

随着AI技术的发展,数据标注工具需要从只支持人工标注逐渐转化为人工标注+AI辅助标注的方法。其基本思路为:基于以往的标注,可以通过AI模型对数据进行预处理,然后由标注人员在此基础上做一些校正。以图像标注为例,标注工具首先通过预训练的语义分割模型来处理图像,并生成多个图像片段、分类标签及其置信度分数。置信度分数最高的片段用于对标签的初始化,呈现给标注者。标注者可以从机器生成的多个候选标签中为当前片段选择合适的标签,或者对机器未覆盖到的对象添加分割段。AI辅助标注技术的应用,能够极大地降低人力成本并使标注速度大幅提升。目前,已经有一些数据标注公司开发了相应的半自动化工具,但是从标注比例来看,机器标注占30%左右,而人工标注占比达到70%左右。因此,数据标注工具的发展趋势是开发以人工标注为主机器标注为辅的半自动化标注工具,同时减少人工标注的比例,并逐步提高机器标注的占比。(WWTQ)

更多好文每日分享,欢迎关注公众号

【版权提示】观研报告网倡导尊重与保护知识产权。未经许可,任何人不得复制、转载、或以其他方式使用本网站的内容。如发现本站文章存在版权问题,烦请提供版权疑问、身份证明、版权证明、联系方式等发邮件至kf@chinabaogao.com,我们将及时沟通与处理。

我国IDC(互联网数据中心)行业现状及竞争分析 电信运营商占据市场主导地位

我国IDC(互联网数据中心)行业现状及竞争分析 电信运营商占据市场主导地位

IDC即互联网数据中心,在IDC平台基础上,IDC服务商为企业和ISP、ICP、ASP等客户提供互联网基础平台服务以及各种增值服务。具体来看,IDC服务包括三大类型:基础服务、安全防护服务和增值服务。

2022年11月28日
我国工业互联网安全行业现状:网络安全形势依旧严峻 内生需求不断扩大

我国工业互联网安全行业现状:网络安全形势依旧严峻 内生需求不断扩大

工业互联网安全是工业互联网的重要保障,又可以称为工业信息安全2.0,主要涉及到设备的安全,控制的安全,网络的安全、标识解析的安全,平台的安全、数据的安全等六大安全问题。其中标识解析的安全,平台的安全,数据的安全,标识的安全是工业互联网安全的新问题。

2022年11月22日
我国母婴电商行业规模现状、用户特征及发展趋势 市场增长势头强劲

我国母婴电商行业规模现状、用户特征及发展趋势 市场增长势头强劲

母婴电商是指通过妈妈和孩子群体切入,以提供母婴商品及母婴服务为主的电商平台。目前母婴电商有综合类、垂直类、社区类等模式。

2022年11月10日
我国软件外包行业现状及竞争分析 软件外包市场规模保持快速增长

我国软件外包行业现状及竞争分析 软件外包市场规模保持快速增长

软件外包是企业为了专注核心竞争力业务和降低软件项目成本,将软件项目中的全部或部分工作发包给提供外包服务的企业完成的软件需求活动。国内金融行业的发展带动软件外包需求快速增加,受国家政策大力支持,软件外包成为我国软件服务市场增长最快的领域。同时,随着国际金融外包为了控制成本向亚太地区转移,我国逐步成为全球软件外包服务中心。

2022年11月08日
我国毫米波有源相控阵微系统行业产业链:上游供应稳定 下游需求旺盛

我国毫米波有源相控阵微系统行业产业链:上游供应稳定 下游需求旺盛

毫米波有源相控阵微系统是毫米波技术和相控阵技术的结合,为一种天线技术,是一项“高精尖”且复杂的微系统产品,由芯片、T/R组件(发射/接受组件)、电源、波控等组成,可使天线波束指向在空间无惯性的捷变。与传统天线相比,毫米波有源相控阵微系统具有空间功率合成、快速扫描、波束赋形、高可靠性等优势。

2022年11月08日
我国信息安全芯片行业发展现状分析—以“云-管-端”领域为例

我国信息安全芯片行业发展现状分析—以“云-管-端”领域为例

安全芯片就是可信任平台模块,是一个可独立进行密钥生成、加解密的装置,内部拥有独立的处理器和存储单元,可存储密钥和特征数据,为电脑提供加密和安全认证服务。用安全芯片进行加密,密钥被存储在硬件中,被窃的数据无法解密,从而保护商业隐私和数据安全。

2022年11月02日
2022年我国隐私计算行业发展环境、现状及竞争情况分析

2022年我国隐私计算行业发展环境、现状及竞争情况分析

隐私计算是指在保护数据本身不对外泄露的前提下实现数据分析计算的技术集合,达到对数据“可用、不可见”的目的;在充分保护数据和隐私安全的前提下,实现数据价值的转化和释放。

2022年11月01日
我国数据库细分市场、竞争及前景分析 国产数据库实力显著增强 行业将加速发展

我国数据库细分市场、竞争及前景分析 国产数据库实力显著增强 行业将加速发展

数据库(DBS)是一个按数据结构来存储和管理数据的计算机软件系统。数据库管理系统(DBMS)是数据库系统(DBS)的核心组成部分,主要完成对数据库的操作与管理功能,实现数据库对象的创建、数据库存储数据的查询、添加、修改与删除操作和数据库的用户管理、权限管理等。

2022年10月24日
微信客服
微信客服二维码
微信扫码咨询客服
QQ客服
电话客服

咨询热线

400-007-6266
010-86223221
返回顶部