前言
近年來,物聯(lián)網(wǎng)、云計算和大數(shù)據(jù)的迅猛發(fā)展使得數(shù)據(jù)呈現(xiàn)指數(shù)級增長,智能文字識別作為文檔數(shù)據(jù)管理的核心技術,迎來良好發(fā)展機遇。2022 年我國智能文字識別市場規(guī)模已超50億元,預計2027年我國智能文字識別市場規(guī)模接近170億元,2022-2027年年復合增長率達27.3%。
按照下游客戶類型及交付形式,智能文字識別服務可分為 C 端標準化產(chǎn)品、B端標準化產(chǎn)品、B 端基礎技術服務、B 端場景化解決方案四種形式。伴隨下游個人用戶和企業(yè)客戶對文檔資產(chǎn)數(shù)字化與智能化升級需求的驅動下,我國智能文字識別各類型細分市場均保持較高增速。從下游領域看,制造業(yè)、金融、物流等對智能文字識別技術需求較大,是智能文字識別技術的主要應用領域。
從競爭情況看,C端競爭方面,智能文字識別類主流APP中掃描全能王先發(fā)優(yōu)勢優(yōu)勢明顯,處于行業(yè)領先地位。B端競爭方面,智能文字識別 B 端市場競爭參與者主要分為谷歌、百度、騰訊、阿里等綜合型 AI 廠商和合合信息、ABBYY等非綜合型 AI 廠商。非綜合型 AI 廠商和綜合型 AI 廠商有著不同的側重領域;且細分市場競爭格局存在差別,形成B 端差異化競爭。
一、智能文字識別正確率高于傳統(tǒng)文字識別,行業(yè)發(fā)展前景廣闊
根據(jù)觀研報告網(wǎng)發(fā)布的《中國智能文字識別行業(yè)發(fā)展趨勢分析與未來前景研究報告(2024-2031年)》顯示,智能文字識別是從圖像中識別出文字的技術,利用機器將圖像中手寫或印刷文本轉化為計算機可以直接處理的格式。智能文字識別能夠處理不同場景的圖像,包括拍攝或掃描得到的各種卡證、紙質文檔圖像,也包括含有文字的自然場景圖像和疊加了字幕文本的視頻圖像等。相比傳統(tǒng)文字識別,智能文字識別具有更強的認知能力和判別力,正確率更高,是個人數(shù)字資產(chǎn)管理及企業(yè)自動化辦公提升的重要工具。
資料來源:觀研天下整理
近年來,物聯(lián)網(wǎng)、云計算和大數(shù)據(jù)的迅猛發(fā)展使得數(shù)據(jù)呈現(xiàn)指數(shù)級增長,智能文字識別作為文檔數(shù)據(jù)管理的核心技術,迎來良好發(fā)展機遇。根據(jù)數(shù)據(jù),2017年我國智能文字識別市場規(guī)模僅為6.1億元,至2022 年我國智能文字識別市場規(guī)模已超50億元,預計2027年我國智能文字識別市場規(guī)模接近170億元,2022-2027年年復合增長率達27.3%。
數(shù)據(jù)來源:觀研天下數(shù)據(jù)中心整理
二、智能文字識別服務內容分為四類,預計未來均保持較高增速
按照下游客戶類型及交付形式,智能文字識別服務可分為 C 端標準化產(chǎn)品、B端標準化產(chǎn)品、B 端基礎技術服務、B 端場景化解決方案四種形式。伴隨下游個人用戶和企業(yè)客戶對文檔資產(chǎn)數(shù)字化與智能化升級需求的驅動下,我國智能文字識別各類型細分市場均保持較高增速。預計2022-2027年我國智能文字識別中基礎技術服務、標準化產(chǎn)品(C端)、標準化產(chǎn)品(B端)、場景化解決方案CAGR分別為16.5%、22.4%、30%、31.6%。
智能文字識別服務分類
服務 | 定義 | 產(chǎn)品形態(tài) | 下游客戶 |
基礎技術服務 | 智能文字識別所需要基礎性技術服務,通常服務于版式相對標準化的文檔、證件識別 | 各類證件識別,如身份證識別、駕照識別、銀行卡識別等技術授權預裝,如手機授權預裝等 | 下游客戶主要為具有一定開發(fā)能力的企業(yè)客戶 |
標準化產(chǎn)品(C端) | 基于智能文字識別技術所打造的標準化、可直接使用的產(chǎn)品 | C端產(chǎn)品文檔管理、名片管理APP部分辦公軟件中也提供智能文字識別功能 | C端產(chǎn)品下游客戶主要為C端個人消費者 |
標準化產(chǎn)品(B端) | 基于智能文字識別技術所打造的標準化的SaaS/PaaS產(chǎn)品 | B端產(chǎn)品面向B端的標準化產(chǎn)品,如名片管理企業(yè)版產(chǎn)品;智能文字識別各類服務相關的SaaS/PaaS產(chǎn)品 | B端產(chǎn)品對標準化SaaS/PaaS產(chǎn)品有需求的企業(yè),主要為中型企業(yè)或大型企業(yè)的部分部門 |
場景化解決方案 | 基于智能文字識別技術、產(chǎn)品,根據(jù)客戶場景化需求而開發(fā)的深度服務解決方案,以幫助B端用戶實現(xiàn)流程數(shù)字化與智能化升級 | AI機器人,如財報分析比對、合同內容比對等AI訓練平臺,下游客戶可自行進行智能文字識別訓練 | 下游客戶主要為B端大型企業(yè)目前NLP等技術在醫(yī)療領域應用(如臨床決策輔助系統(tǒng)、病例質控系統(tǒng)等)較為廣泛,所以目前場景化解決方案有較多醫(yī)療企業(yè)客戶 |
資料來源:觀研天下整理
數(shù)據(jù)來源:觀研天下數(shù)據(jù)中心整理
三、金融、物流等對智能文字識別技術需求相對較大,為行業(yè)主要下游應用領域
制造業(yè)、政府、房地產(chǎn)、物流、醫(yī)療健康、金融企業(yè)對業(yè)務流程方面的基礎信息化建設程度投入意愿相對較高,在證照、單據(jù)、表格等文檔的智能錄入、分類、比對、審核方面進行降本增效具有較大需求,是智能文字識別技術的主要應用領域。預計2020-2025年我國制造業(yè)、政府、房地產(chǎn)、物流、醫(yī)療健康、個人消費者、泛金融、其他領域智能文字識別市場規(guī)模CAGR分別為54.1%、49.4%、43.1%、36.5%、36.2%、33.8%、29.6%、25.7%。
數(shù)據(jù)來源:觀研天下數(shù)據(jù)中心整理
四、智能文字識別 APP 中掃描全能王發(fā)展領先,B端細分市場格局存在差異
從C端競爭看,智能文字識別類主流APP包括掃描全能王CamScanner、Officelens、GoogleLens、ABBYY FineScanner、AdobeScan、Scannable掃描寶,其中掃描全能王已經(jīng)在用戶規(guī)模、品牌知名度、用戶口碑等方面建立了先發(fā)優(yōu)勢,在文字識別 APP 領域保持行業(yè)領先地位。
文字識別類主流APP基本情況
APP | 簡介 | 上線時間 | 用戶數(shù)量 | 用戶體驗 |
掃描全能王CamScanner | 將智能手機變成便攜式掃描儀,采集、管理各種文檔產(chǎn)品,支持文檔圖片的智能切邊、智能圖像增強、票據(jù)/證照/表格等多種文檔的文字識別功能 | 2010 年 | 2023 年的平均月活為 14,540.4 萬 | iOS 中國區(qū)評分 4.9,評分個數(shù) 450.6 萬個iOS 美國區(qū)評分為 4.9,評分個數(shù) 126.3 萬個 |
Officelens | 微軟集團旗下的掃描與文字識別產(chǎn)品,可將圖像轉換為 PDF、Word、PowerPoint 或 Excel 文件,將打印或手寫文本數(shù)字化 | 2015 年 | 2023 年的平均月活為 1,269.6 萬 | iOS 中國區(qū)評分 4.9,評分個數(shù) 3.1 萬個iOS 美國區(qū)評分為 4.8,評分個數(shù) 10.7 萬個 |
GoogleLens | 微軟集團旗下的掃描與文字識別產(chǎn)品,可將圖像轉換為 PDF、Word、PowerPoint 或 Excel 文件,將打印或手寫文本數(shù)字化 | 2017 年 | 2023 年的平均月活為 2,488.1 萬 | Googlelens未在 AppStore 上架 |
ABBYY FineScanner | ABBYY 集團旗下開發(fā)的產(chǎn)品,可從掃描內容中提取文本進行進一步編輯和共享 | 2012 年 | 2023 年的平均月活為 4.1 萬 | iOS 中國區(qū)評分 4.8,評分個數(shù) 0.7 萬個iOS 美國區(qū)評分為 4.7,評分個數(shù) 1.9 萬個 |
AdobeScan | Adobe 集團旗下開發(fā)的掃描與文字識別產(chǎn)品,能夠將任何紙質文檔轉換為AdobePDF,同時具備 OCR 功能 | 2017 年 | 2023 年的平均月活為 6,623.6 萬 | iOS 中國區(qū)未上架iOS 美國區(qū)評分為 4.9,評分個數(shù) 123.6 萬個 |
Scannable掃描寶 | Evernote 印象筆記旗下的掃描與文字識別產(chǎn)品,可將紙質文件掃描成圖片,并支持 OCR 文字識別,可無縫對接至印象筆記 | 2010 年 | 2023 年的平均月活為 48.9 萬 | iOS 中國區(qū)評分 4.9,評分個數(shù) 13.0 萬個iOS 美國區(qū)未上架 |
資料來源:觀研天下整理
從B端看,智能文字識別 B 端市場競爭參與者主要分為谷歌、百度、騰訊、阿里等綜合型 AI 廠商和合合信息、ABBYY等非綜合型 AI 廠商。
綜合型 AI 廠商旗下云平臺提供的 B 端服務范圍廣泛且多元,包含云服務器、云存儲、云數(shù)據(jù)庫、人臉識別、語音識別、視頻分發(fā)加速等相關產(chǎn)品,智能文字識別僅為其中一種產(chǎn)品。綜合型 AI 廠商切入 OCR 領域的主要原因是:基于其成熟的公有云 PaaS 平臺提供基礎化、標準化的 OCR 識別服務的邊際成本較低,拓展 OCR 業(yè)務的主要目的是進一步提升其云平臺服務的豐富度。但拓展場景化的解決方案市場需大量人力、研發(fā)投入配合客戶的個性化需求,項目周期也較長,邊際成本較高。而非綜合型 AI 廠商核心業(yè)務即為智能文字識別,但其在智能文字識別業(yè)務投入的人員與資金較為有限。
非綜合型 AI 廠商和綜合型 AI 廠商有著不同的側重領域,形成B 端差異化競爭。
智能文字識別B 端市場競爭參與者分類及其基本情況
類別 |
側重領域差異化 |
公司名稱 |
公司簡介 |
在智能文字識別領域的產(chǎn)品/服務 |
綜合型 AI 廠商 |
智能文字識別不是其主要核心業(yè)務 |
百度云 |
又稱“百度智能云”,是百度集團旗下的云服務平臺,創(chuàng)立于2015年。其專注云計算、智能大數(shù)據(jù)、人工智能服務,提供云服務器、云主機、云存儲、CDN、域名注冊、物聯(lián)網(wǎng)等云服務。 |
智能文字識別是百度云平臺提供的能力之一,以提供API/SDK標準化PaaS產(chǎn)品為主:近年開始布局場景化解決方案,2020年推出智能文字識別平臺TextMind:2021年上線EasyDLOCR智能文字識別模型自訓練平臺。 |
騰訊云 |
是騰訊集團旗下的云服務平臺,2013年創(chuàng)立。其提供云計算、大數(shù)據(jù)、人工智能服務,涵蓋云服務器、云數(shù)據(jù)庫、云存儲、視頻與CDN、域名注冊等全方位云服務和各行業(yè)解決方案。 |
智能文字識別是騰訊云平臺提供的能力之一,以提供API/SDK標準化PaaS產(chǎn)品為主。 |
||
阿里云 |
是阿里巴巴集團旗下云服務平臺,創(chuàng)立于2009年。其提供云服務器、云數(shù)據(jù)庫、云安全、云企業(yè)應用等云計算服務,以及大數(shù)據(jù)、人工智能服務、精準定制基于場景的行業(yè)解決方案。 |
智能文字識別是阿里云平臺提供的能力之一,以提供API/SDK標準化PaaS產(chǎn)品為主。 |
||
Google Cloud |
是Google 集團旗下的云計算服務平臺。其提供云計算、數(shù)據(jù)存儲、數(shù)據(jù)分析等一系列國際化的云服務。 |
Google Cloud平臺以提供API/SDK標準化PaaS產(chǎn)品為主,較少提供場景化解決方案。另外Google在C端APP有Google Lens產(chǎn)品。 |
||
非綜合型 AI 廠商 |
智能文字識別是其主要核心業(yè)務 |
ABBYY |
1989年創(chuàng)立,是一家提供PC和移動設備OCR、文檔識別軟件和計算機輔助語言學習軟件的國際軟件公司。ABBYY在世界各地通過區(qū)域和國際合作伙伴的廣泛網(wǎng)絡,產(chǎn)品已遠銷130多個國家。 |
B端服務方面包括基礎技術服務、標準化服務、場景化解決方案,客戶以國外客戶為主,C端產(chǎn)品包括ABBYYFineScanner、ABBYYBusiness Card Reader。 |
合合信息 |
公司成立于 2006 年。2016年公司將深度學習算法、自然語言處理技術與 OCR 技術相結合,自主研發(fā)智能文字識別技術,大幅度提升了智能文字識別技術的性能和應用場景,并將 AI 技術落地成為產(chǎn)品級應用。 |
在 B 端業(yè)務方面,2016 年,公司正式成立企業(yè)級智能解決方案事業(yè)部,面向行業(yè)頭部客戶,輸出超過 100 種證照的 OCR 基礎模塊服務,布局文字識別 B 端企業(yè)服務領域。2017 年開始,公司針對不同行業(yè)復雜場景的文字識別進行更多元化的商業(yè)化探索,加速布局智能文字識別 AI 機器人、AI 訓練平臺等場景化解決方案。在 C 端產(chǎn)品方面,公司在 2010 年把握住了移動互聯(lián)網(wǎng)的高速發(fā)展機遇,上線了名片全能王、掃描全能王兩大產(chǎn)品,目前已在用戶數(shù)量、用戶體驗、核心技術等方面獨特的競爭優(yōu)勢。 |
資料來源:觀研天下整理
智能文字識別 B 端服務不同細分市場的競爭格局存在差異。基礎技術服務市場參與者較多,包含智能文字識別廠商、傳統(tǒng)文字識別廠商、云服務平臺廠商等?;A技術服務存在一定程度的同質化競爭。
標準化B端產(chǎn)品處于發(fā)展早期,由于打造標準化SaaS(軟件即服務)、PaaS(平臺即服務)產(chǎn)品的技術門檻較高,目前僅有少數(shù)企業(yè)布局,目前主要參與者為合合信息(提供SaaS產(chǎn)品服務)、少數(shù)云服務平臺(如阿里云、百度云、騰訊云等,提供PaaS服務)
由于場景化解決方案通常需要于客戶現(xiàn)場進行實施部署,因此具有區(qū)域性,市場分布較為分散。國內幾大云平臺服務廠商及部分AI企業(yè)開始布局場景化解決方案,但是由于行業(yè)理解及業(yè)務場景落地能力需要長時間的經(jīng)驗積累,目前商業(yè)化落地案例較為有限。
B 端服務不同細分市場的競爭格局
B端細分市場 | 競爭情況 |
基礎技術服務 | 基礎技術服務市場參與者較多,包含智能文字識別廠商、傳統(tǒng)文字識別廠商、云服務平臺廠商等?;A技術服務存在一定程度的同質化競爭。 |
標準化B端產(chǎn)品 | 標準化B端產(chǎn)品處于發(fā)展早期,由于打造標準化SaaS(軟件即服務)、PaaS(平臺即服務)產(chǎn)品的技術門檻較高,目前僅有少數(shù)企業(yè)布局,目前主要參與者為合合信息(提供SaaS產(chǎn)品服務)、少數(shù)云服務平臺(如阿里云、百度云、騰訊云等,提供PaaS服務) |
場景化解決方案 | 由于場景化解決方案通常需要于客戶現(xiàn)場進行實施部署,因此具有區(qū)域性,市場分布較為分散。國內幾大云平臺服務廠商及部分AI企業(yè)開始布局場景化解決方案,但是由于行業(yè)理解及業(yè)務場景落地能力需要長時間的經(jīng)驗積累,目前商業(yè)化落地案例較為有限。 |
資料來源:觀研天下整理(zlj)
【版權提示】觀研報告網(wǎng)倡導尊重與保護知識產(chǎn)權。未經(jīng)許可,任何人不得復制、轉載、或以其他方式使用本網(wǎng)站的內容。如發(fā)現(xiàn)本站文章存在版權問題,煩請?zhí)峁┌鏅嘁蓡?、身份證明、版權證明、聯(lián)系方式等發(fā)郵件至kf@chinabaogao.com,我們將及時溝通與處理。