咨询热线

400-007-6266

010-86223221

自然语言处理行业:ChatGPT带动NLP发展步入快车道 语音交互是NLP的下一个掘金点

1、自然语言处理(NLP)行业定义、分类及特点

自然语言处理( Natural Language Processing, NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系,但又有重要的区别。自然语言处理并不是一般地研究自然语言,而在于研制能有效地实现自然语言通信的计算机系统,特别是其中的软件系统。因而它是计算机科学的一部分。

根据观研报告网发布的《中国自然语言处理行业发展趋势研究与投资前景预测报告(2023-2030年)》显示,从应用领域来看,自然语言处理主要应用于自动问答、信息检索、情感分析方面。此外,机器翻译、舆情监测、自动摘要、观点提取、文本分类、文本语义对比、语音识别、中文OCR等方面也有着不同程度的应用。

自然语言处理的应用领域介绍

领域 介绍
自动问答 自动问答应用涉及自然语言的词法、句法、语义等分析问题,是自然语言理解与生成技术应用的集中体现。自动问答系统能自动回答用户提出的问题,反馈给用户基于自然语言表述的答案,不再是简单的基于关键词匹配排序的文档列表,系统在生成答案的操作中需要正确理解用户所提出的问题,抽取用户问题中的关键信息,进而检索语料库或知识库,将可匹配的最佳答案用自然语言的形式反馈给用户,完成自动问答任务。
信息检索 信息检索是计算机自主从文档集合中查找用户所需信息的过程。信息检索系统将信息标引、描述以及组织整理后存在于数据库中,将用户输入的检索关键词与数据库中信息的标引词匹配,实现用户的信息检索要求。信息检索要求计算机理解用户输入的自然语言信息,自动将自然语言信息与数据库中的标引信息进行比对,以达成检索任务。如谷歌搜索引擎可通过理解用户输入的自然语言关键词,反馈给用户一个检索目标页面列表,用户可在列表中选择能够满足自己信息需求的页面加以浏览。因为搜索引擎无法通过简单的关键词表达体会用户真正的查询意图,只能将所有可能满足用户需求的结果集合以列表的形式提供给用户。
情感分析 情感分析(意见挖掘),是计算机系统自主对文本的情感倾向(如主观/客观,积极/消极,喜欢/讨厌等)进行挖掘和分析的过程。情感分析能帮助商家自动处理用户评论,将分析过的评论按照排序规则进行展示,帮助商家获得广告营销效果,如淘宝、天猫等电商平台、携程、爱彼迎等旅游住宿平台的商家在评论区可设置自动置顶反映积极情绪的用户评论,置后部分反映负面信息的用户评论,达到吸引用户眼球的效果。商家还可通过分析用户发布的信息了解用户喜好,实现精准营销,如新浪微博上的零售商可根据用户发表的微博,微话题等内容了解用户的个人喜好,为用户定制性的推送优惠及新品信息。

资料来源:观研天下数据中心整理

从行业特点来看,自然语言处理行业具有多学科交叉综合、技术水平高的特点,涉及言学、数学、计算机科学等众多学科领域。垂直领域场景所使用的NLP技术纷繁复杂,特点如下:NLP技术在部分领域具有一定的通用性,比如通用内容审核、机器翻译、语音识别等;大量的应用场景中,NLP技术的迁移能力较差,需要高度定制,如非制式合同文本抽取、会话机器人、文档审核、特定领域文本纠错等;NLP技术还不能很好地融合领域知识,仍然需大量人工工作,需要业务与技术人员深度配合,通常将大量精力放在数据清洗、数据标注上。从行业地位来看,NLP是人工智能(AI)的一个子领域,是人工智能桂冠上最闪耀的明珠,也是未来所有人工智能技术的基础和根本。

2、需求带动与能力提升共同作用下,市场规模保持稳步增长

数据显示,2022年我国自然语言处理软件及服务市场规模达到174.5亿元,突破了150亿的大关,在新业态不断涌现,虚拟人市场、人机交互需求日益扩大的背景下,预计自2026年起,自然语言处理市场将保持35%以上的增速,到2028年,中国NLP(特指NLP核心技术与产品市场,包括自然语言处理相关的软件产品、平台、系统和解决方案服务)市场规模将超过千亿元。

自然语言处理产品与人工智能行业天然适配性较高,一方面,中国从制造业走到互联网,再发展到移动端,未来要走的就是以人为本的服务经济路线。而企业的服务在发展的过程中,唯一不变的追求的是「降本增效」与「提质」。而为「人」服务一定会产生交互,如今的交互多数来源于互联网 App的点击、发送指令等方式,但人最原始的交互方式是言语交流,最后无论是服务还是技术,也是会追求和回归到这个本质上。而想要理解人的交互,必须要懂得人讲话的意图与情绪/情感。不理解意图和情绪/情感,就无法理解言语的真正含义,在自然语言处理上就无法达到流畅。所以这时候企业需要的,是可以在降低成本的同时还能把服务做到位的解决方案和工具,来达到「降本增效」的作用,因而对自然语言处理产品需求强烈,这也是未来服务经济需要优化现状的部分。另一方面,在AI产业蓬勃发展、市场竞争愈发激烈的倒逼下,符合企业需求的高标准NLP数据服务已成为行业头部企业的刚需,加上NLP作为AI技术中的一个重要分支,同样依赖算力、算法、数据三因素。其中,算力基于IT基础设施的发展,NLP算法基于深度学习的突破,在近年来都得到了较大的进展,也正因如此自然语言处理市场规模可保持稳步增长。

当前自然语言处理技术中最为引人注目的就是OpenAI推出的ChatGPT模型。它的出现,一方面促进了智能客服、智能政务、智能诊疗等领域NLP(人工智能服务提供商)的应用,另一方面,也促进了NLP技术的发展,使得更多的研究者可以借鉴和学习ChatGPT的技术,并应用到自己的研究中。例如,可以研究如何更好地训练聊天机器人模型,以及如何设计更具人性的聊天机器人。总的来说,ChatGPT的出现将带动NLP行业发展步入快车道。预计到2030年,市场规模将超过2千亿元,2022-2030年均复合增长率达到36.5%。

当前自然语言处理技术中最为引人注目的就是OpenAI推出的ChatGPT模型。它的出现,一方面促进了智能客服、智能政务、智能诊疗等领域NLP(人工智能服务提供商)的应用,另一方面,也促进了NLP技术的发展,使得更多的研究者可以借鉴和学习ChatGPT的技术,并应用到自己的研究中。例如,可以研究如何更好地训练聊天机器人模型,以及如何设计更具人性的聊天机器人。总的来说,ChatGPT的出现将带动NLP行业发展步入快车道。预计到2030年,市场规模将超过2千亿元,2022-2030年均复合增长率达到36.5%。

资料来源:观研天下整理

观研天下分析师观点:近日ChatGPT的火爆出圈,对行业的影响非常大,可以预见的是,ChatGPT以及一系列超大规模预训练语言模型的成功将为自然语言处理带来新的范式变迁

3、NLP技术的发展将带动虚拟人市场爆发式增长

从需求市场来看,受人工智能商业化应用落地的不断推进,搜索引擎、智能客服、舆情分析、智能内容处理、数字虚拟人等应用愈发广泛,NLP作为核心技术之一需求量加速增长。其中,数字虚拟人需求端的热情给予产业上的公司诸多掘金的机会。

一般而言,虚拟人指由 CG 技术构建、以代码形式运行的拟人化形象。其理性认知能力中的决策能力正对应于AI中的NLP,可以说,NLP大模型是AI驱动虚拟人技术基石,其情感化交互体验核心会极大程度决定了能否呈现自然的面部表情变动、肢体变动等,并且能否对情感等因素进行特别设计对AI陪伴数字人呈现效果影响巨大。未来也可以根据人格、用户喜好对虚拟人进行NLP交互的个性化定制。NLP技术企业通过积累各场景行业术语及各行业知识图谱,赋予虚拟数字人知识储备、语义理解、推理分析、自主决策和交互表达的智慧能力。未来NLP技术会成为推动虚拟人发展的核心关键技术,与此同时,NLP技术的落地和使用也将带来虚拟人市场的爆发式增长。据观研天下预测,到2030年,我国虚拟数字人整体市场规模将突破2800亿元,相应的商业模式也将持续演进与多元。

一般而言,虚拟人指由 CG 技术构建、以代码形式运行的拟人化形象。其理性认知能力中的决策能力正对应于AI中的NLP,可以说,NLP大模型是AI驱动虚拟人技术基石,其情感化交互体验核心会极大程度决定了能否呈现自然的面部表情变动、肢体变动等,并且能否对情感等因素进行特别设计对AI陪伴数字人呈现效果影响巨大。未来也可以根据人格、用户喜好对虚拟人进行NLP交互的个性化定制。NLP技术企业通过积累各场景行业术语及各行业知识图谱,赋予虚拟数字人知识储备、语义理解、推理分析、自主决策和交互表达的智慧能力。未来NLP技术会成为推动虚拟人发展的核心关键技术,与此同时,NLP技术的落地和使用也将带来虚拟人市场的爆发式增长。据观研天下预测,到2030年,我国虚拟数字人整体市场规模将突破2800亿元,相应的商业模式也将持续演进与多元。

资料来源:观研天下整理

4、自然语言处理与AI应用开展交汇融合,厂商参与更加丰富多元

依托于数据驱动和知识驱动两条技术路线,自然语言处理与AI应用产品已逐步开展交汇融合,展现出融合创新的特性,主要发展方向可归纳为两类:“由自然语言处理到开发AI应用平台/产品”与“AI应用平台/产品开发到面向AI的自然语言处理”:1)自然语言处理厂商在积累数据经验与AI模型理解后,为实现业务拓展而将领域从数据层延伸至AI应用及平台开发层;2)从事AI应用及平台开发的AI厂商,也会在自然语言处理经验不断丰富的背景下,着手向底层开展面向AI的自然语言处理业务,依托于自身AI技术与业务理解,让而向AI的数据源更加契合AI应用模型要求以提升模型拟合效果。例如:日前,央视新闻联合百度智能云打造的总台首个AI手语主播亮相,将成为听障人士在冬奥会期间“智”听新闻的伙伴。栩栩如生的“数字人”背后,依托的是百度智能云语音识别、自然语言处理、计算机视觉等AI技术;跨国制药公司礼来(Eli Lilly)正在使用自然语言处理帮助全球三万多名员工在公司内部和外部共享准确的、及时的信息。因此,综合来看,自然语言处理行业的玩家不仅仅包括传统自然语言处理厂商,还包括众多AI企业、互联网科技企业等,参与者更加丰富多元。

自然语言处理与AI融合的商业应用案例

企业 应用
美国礼来公司:通过自然语言处理在全球开展业务 跨国制药公司礼来(Eli Lilly)正在使用自然语言处理帮助全球三万多名员工在公司内部和外部共享准确的、及时的信息。礼来公司开发了一套名为Lilly Translate的本土IT解决方案,使用自然语言处理和深度学习,通过经过验证的API层生成内容翻译。
埃森哲:使用自然语言处理分析合同 埃森哲正在利用自然语言处理做法律分析。埃森哲的法律智能合同探索(Accenture Legal Intelligent Contract Exploration,ALICE)项目帮助这家有2800名专业人士的全球服务企业在其数百万份合同中进行文本搜索,包括搜索合同条款等。
Verizon:利用自然语言处理回应客户请求 Verizon的业务服务保障部门正在使用自然语言处理和深度学习来自动处理客户的请求评论。该部门每个月会收到10万多个入站请求,以前,他们必须阅读这些请求并采取措施,直到Verizon的IT部门——Global Technology Solutions (GTS)——打造了支持AI-Enabled Digital Worker for Service Assurance。
Great Wolf Lodge:使用自然语言处理驱动的AI追踪客人情绪 医院和娱乐连锁商Great Wolf Lodge开发的Artificial Intelligence Lexicographer(GAIL)利用自然语言处理会对月度调研中的评论进行筛选,确定作者是否可能是网络水军、批评者或者中立方。
Aetna:通过自然语言处理快速解决索赔 健康保险公司Aetna开发了Auto-adjudication of Complex Provider Contracts应用,该应用融合了自然语言处理和特殊数据库软件,以识别支付属性,构建可由系统自动读取的附加数据。可用于自动阅读每份合同中有关付款、免赔额和无关费用说明的注释,然后计算定价并更新索赔。

资料来源:观研天下数据中心整理

从国内市场来看,NLP行业的主要玩家可以分为两类:NLP技术企业和互联网科技企业。NLP技术企业由于深耕技术研发多年,技术先进性强,数据乃至人才方面都有着天然优势,可满足不同行业下游用户的定制化需求。其中,拓尔思在NLP领域具备自主可控底层技术,在国内NLP市场中占有重要地位。值得一提的是,近年来主要云厂商与典型技术供应商市场占有率逐年下降,主要系应用场景与业务拓展、厂商相关业务逐渐成熟所致。考虑到大模型开发成本高,且大模型商业化路径仍未闭环,加之目前经济形势影响,对所有技术供应商形成长期竞争优势均有较大考验,因此资本市场的偏好将对自然语言处理市场的竞争格局产生较大影响。

从国内市场来看,NLP行业的主要玩家可以分为两类:NLP技术企业和互联网科技企业。NLP技术企业由于深耕技术研发多年,技术先进性强,数据乃至人才方面都有着天然优势,可满足不同行业下游用户的定制化需求。其中,拓尔思在NLP领域具备自主可控底层技术,在国内NLP市场中占有重要地位。值得一提的是,近年来主要云厂商与典型技术供应商市场占有率逐年下降,主要系应用场景与业务拓展、厂商相关业务逐渐成熟所致。考虑到大模型开发成本高,且大模型商业化路径仍未闭环,加之目前经济形势影响,对所有技术供应商形成长期竞争优势均有较大考验,因此资本市场的偏好将对自然语言处理市场的竞争格局产生较大影响。

资料来源:观研天下整理

观研天下分析师观点:从技术角度来看,NLP具有很强的技术开放性,方法论的壁垒不容易维持,有利于创业公司的快速学习跟进和技术迭代;但其大规模语言模型的“军备竞赛”从另一个维度建立起了壁垒,对小型公司不友好,因此通过打造底层通用模型/引擎的方式实现大规模商业化可能并不适合一般的创业公司

5、金融领域是NLP应用的主场,旅游、零售等市场需求旺盛

目前,金融领域是自然语言处理(NLP)应用的主场。数据显示,2022年AI+ 金融领域自然语言处理核心产品市场规模达到41亿元,预计2026年核心产品市场规模将达到91亿元,2022-2026CAGR=24.9%。自然语言技术区别于其他AI技术,在金融领域中通常不以独立产品的形式出售,而是作为底层技术结合智能语音、知识图谱等技术,以对话式AI、机器翻译、知识库等产品形式出现,而独立产品化模块发展相对缓慢。目前NLP在金融领域主要的应用场景有智能客服、信息舆情、情感分析、文档审核及比对、文档结构化等。

目前,金融领域是自然语言处理(NLP)应用的主场。数据显示,2022年AI+ 金融领域自然语言处理核心产品市场规模达到41亿元,预计2026年核心产品市场规模将达到91亿元,2022-2026CAGR=24.9%。自然语言技术区别于其他AI技术,在金融领域中通常不以独立产品的形式出售,而是作为底层技术结合智能语音、知识图谱等技术,以对话式AI、机器翻译、知识库等产品形式出现,而独立产品化模块发展相对缓慢。目前NLP在金融领域主要的应用场景有智能客服、信息舆情、情感分析、文档审核及比对、文档结构化等。

资料来源:观研天下整理

此外,当前旅游、零售、保险、教育、医疗等领域已经成为了自然语言处理陆续“进军”的战略重点。例如:自然语言处理(NLP)在旅游领域的应用主要体现为情感分析、预测未来趋势、语音识别和语音合成,在零售领域的应用主要体现为聊天机器人客服、语音搜索、情感分析和文本挖掘和关键词提取,在保险领域的应用主要体现为理赔处理、聊天机器人客服、OCR、核保流程、欺诈检测和客户服务。

此外,当前旅游、零售、保险、教育、医疗等领域已经成为了自然语言处理陆续“进军”的战略重点。例如:自然语言处理(NLP)在旅游领域的应用主要体现为情感分析、预测未来趋势、语音识别和语音合成,在零售领域的应用主要体现为聊天机器人客服、语音搜索、情感分析和文本挖掘和关键词提取,在保险领域的应用主要体现为理赔处理、聊天机器人客服、OCR、核保流程、欺诈检测和客户服务。

资料来源:观研天下整理

6、NLP商业化落地仍面临挑战,语音交互未来商业应用潜力大

NLP技术一直在工业界平稳落地,不论是搜索引擎、个性化推荐、信息流、互联网金融还是社交网络,NLP技术都在其中起着十分重要的作用,但技术到落地到商业化,面临一系列的挑战。一方面,NLP技术准确率远远没有达到计算机视觉和语音识别的水平,很多智能交互系统针对的往往是单一领域里某个单一任务,因此应用非常受限,要出现爆款产品还需突破技术藩篱;另一方面,自然语言处理技术要实现突破性进展,无论是挖人还是模型的迭代和训练都非常烧钱,而此时客户和收入都很有限,因此很难实现盈利,在应用早期基本属于头部玩家的游戏,很难出现有代表性的标杆企业。

此外,自然语言处理领域其他亟待解决的问题还有任务驱动对话系统、语言资源不足和偏见、预估最坏情况案例性能、领域适应、有意义的文本和对话生成、迁移学习、拥有长期的目标/任务导向的人机对话、收集数据的方法、指代消解、词义消歧、文本摘要、民主化等,这些都是业界比较关心的话题,解决了这些技术上的问题,商业化应用才能更加顺利地开展。预计具有个性化特性、覆盖全场景的语音交互,未来非常有机会成为主要的人机交互方式,具有广阔的商业化应用潜力,同时,搜索、推荐、问答和对话等场景下也有较大的商业化应用潜力。

观研天下分析师观点:虽然NLP在多个行业中均有广泛应用,但其本身并不能独立构成商业模式,更多地是辅助一些领域、业务的发展,考虑到NLP对于使用NLP工具的创业公司来说,行业knowhow与NLP技术同等重要,专注于细分赛道、在垂直领域开展业务的创业公司依然有机会比大公司做得更好。(LZC

更多好文每日分享,欢迎关注公众号

【版权提示】观研报告网倡导尊重与保护知识产权。未经许可,任何人不得复制、转载、或以其他方式使用本网站的内容。如发现本站文章存在版权问题,烦请提供版权疑问、身份证明、版权证明、联系方式等发邮件至kf@chinabaogao.com,我们将及时沟通与处理。

我国数据标注行业:下游持续扩张带来可观发展前景 未来市场有望快速增长

我国数据标注行业:下游持续扩张带来可观发展前景 未来市场有望快速增长

近年来数据标注行业发展迅速,行业内涌现了大批量的中小企业,据统计截止2023年数据标准行业相关企业数达到1123家,呈现出井喷的趋势。未来,在大数据产业的不断发展下,预计数据标注相关企业数量将呈现不断增长趋势。

2024年03月08日
我国智算中心行业市场规模稳增长 政府、运营商、互联网企业等积极布局

我国智算中心行业市场规模稳增长 政府、运营商、互联网企业等积极布局

AI服务器能够提供人工智能数据服务,是算力基础设施之一。智能算力规模以AI服务器为基础,全球AI服务器市场规模不断上升,据IDC数据,2022年全球AI服务器销售额为183亿美元,同比增长17.3%。我国AI服务器销售额持续增长,2022年AI服务器销售额为523.5亿元,2018-2022年均复合增长率达17.7%。

2024年02月27日
我国数字经济行业:发展活力持续释放 产业数字化探索更加丰富多样

我国数字经济行业:发展活力持续释放 产业数字化探索更加丰富多样

2022 年我国数据产量达 8.1ZB,同比增长 22.7%,占全球数据总产量 10.5%,位居世界第二。截至 2022 年底,我国存力总规模超 1000EB,数据存储量达 724.5EB,同比增长 21.1%,占全球数据总存储量的 14.4%。

2024年02月27日
我国工业互联网产业溢出赋能成效显著  逐渐步入创新发展新阶段

我国工业互联网产业溢出赋能成效显著 逐渐步入创新发展新阶段

2023年是《工业互联网创新发展行动计划(2021—2023年)》实施的收官之年,工业互联网创新发展行动计划实施的两年多以来,工信部坚持适度超前,基础设施已全面建成。

2024年02月24日
我国大数据行业呈现出快速发展态势 金融领域为最大细分市场

我国大数据行业呈现出快速发展态势 金融领域为最大细分市场

在网络基础资源方面,截至2023年6月,我国域名总数为3024万个;IPv6活跃用户数达7.67亿;移动电话基站总数达1129万个,其中累计建成开通5G基站293.7万个,占移动基站总数的26%;移动互联网应用蓬勃发展,国内市场上监测到的活跃App数量达260万款,进一步覆盖网民日常学习、工作、生活。

2024年02月22日
我国算力租赁市场正处于快速发展期  大数据驱动下行业前景广阔

我国算力租赁市场正处于快速发展期 大数据驱动下行业前景广阔

在数据中心领域,作为算力的物理承载,国内数据中心持续建设与扩容,推动数据中心总机架数连年增长。2018-2022年总机架数由 266 万架增至650万架,近5年年均增速超过30%。预计2025年大型及以上数据中心机架数量将达到802万个,相应的算力规模持续扩大。

2024年02月20日
政策聚焦测绘地理信息事业转型升级 行业迈向数字化、智能化新纪元

政策聚焦测绘地理信息事业转型升级 行业迈向数字化、智能化新纪元

尽管我国已经出台了一系列测绘地理信息相关的法律法规和政策文件,但随着地理信息产业的发展,现有的政策法规已经不能完全满足行业发展的需要。一些新兴的领域和问题,如地理信息共享、隐私保护、安全保障等,缺乏有效的政策法规进行规范和管理。

2023年12月26日
我国数据中心市场规模呈爆炸式增长 并购潮下或将呈现强者愈强趋势

我国数据中心市场规模呈爆炸式增长 并购潮下或将呈现强者愈强趋势

作为海量数据的载体,互联网数据中心建设成为大势所趋,未来几年我国数据中心市场仍将处于快速发展期。截止2022年,我国数据中心行业市场规模约为1961.5亿元,在庞大的市场体量面前,我国数据中心市场格局显得较为分散。

2023年12月14日
微信客服
微信客服二维码
微信扫码咨询客服
QQ客服
电话客服

咨询热线

400-007-6266
010-86223221
返回顶部