自2021服貿(mào)會召開以來,北京衛(wèi)視一直在對會中涌現(xiàn)的服務(wù)創(chuàng)新型企業(yè)進(jìn)行深入關(guān)注。10月17日,在北京衛(wèi)視的財經(jīng)頻道中,播出了易道博識聯(lián)合創(chuàng)始人兼首席技術(shù)官康鐵鋼接受北京衛(wèi)視的采訪,并對易道博識的技術(shù)積累,產(chǎn)品服務(wù)和行業(yè)領(lǐng)先度等方面給予了高度認(rèn)可。
“深度學(xué)習(xí)的成熟,給文字識別,人臉識別的識別率帶來了巨大提升,除了涌現(xiàn)大量的AI初創(chuàng)公司,也有很多實際的落地場景,我們公司從創(chuàng)立開始就擁抱深度學(xué)習(xí),并圍繞深度學(xué)習(xí)搭建了我們的產(chǎn)品矩陣?!笨佃F鋼在采訪中介紹道。
但是,深度學(xué)習(xí)在實際應(yīng)用中條件很苛刻。人工智能模型的開發(fā)與上線應(yīng)用需要經(jīng)歷從業(yè)務(wù)理解、數(shù)據(jù)采標(biāo)及處理、模型訓(xùn)練與測試到運(yùn)維監(jiān)控等一系列流程。過程中需要大量的AI算力、高質(zhì)量數(shù)據(jù)源、Al應(yīng)用算法研發(fā)及Al技術(shù)人員的支持。
而事實上,大部分中小企業(yè)用戶并不具備在“算力、數(shù)據(jù)、算法”三維度從0到1部署的能力,而財力雄厚的大型企業(yè)亦需高性價比的AI開發(fā)部署方案。
所以,如何AI基礎(chǔ)層服務(wù)在多環(huán)節(jié)提升技術(shù)價值,AI產(chǎn)業(yè)如何進(jìn)入低技術(shù)門檻、低部署成本、各產(chǎn)業(yè)深度參與雙向共建的效率化生產(chǎn)階段,是企業(yè)當(dāng)下面臨的重要問題。
假如,每次開發(fā)模型都需要算法工程師單獨(dú)完成從生產(chǎn)到上線的全流程招建,就會導(dǎo)取很多時間的耗損與AI模型開發(fā)成本的浪費(fèi)。所以集標(biāo)注、訓(xùn)練、推理于一體的賽博(Cybot)深度學(xué)習(xí)平臺應(yīng)運(yùn)而生。
賽博學(xué)習(xí)平臺是易道博識基于深度學(xué)習(xí)自主研發(fā)的全棧式數(shù)據(jù)服務(wù)平臺,包含數(shù)據(jù)標(biāo)注平臺、訓(xùn)練平臺、推理平臺、接口平臺、管理平臺5大部分,涵蓋數(shù)據(jù)標(biāo)注,數(shù)據(jù)訓(xùn)練、推理服務(wù)三大數(shù)據(jù)服務(wù)環(huán)節(jié),可提供模型開放及模型訓(xùn)練的流水線定制化服務(wù)。
賽博學(xué)習(xí)平臺的出現(xiàn)凝聚了易道博識2013年創(chuàng)立以來,在文字識別,圖像識別等核心技術(shù)上近十年的技術(shù)沉淀和經(jīng)驗積累,也與驅(qū)動AI業(yè)務(wù)的外因以及企業(yè)自身的內(nèi)因緊密相關(guān)。從外因看,規(guī)?;鄨鼍暗臉I(yè)務(wù)不斷衍生出長尾需求,原有的應(yīng)用需及時更新;從內(nèi)因看,囿于開發(fā)企業(yè)有限的經(jīng)營成本與AI技術(shù)人才,其資源主要投放到現(xiàn)階段的主營業(yè)務(wù),現(xiàn)有人員難以推動業(yè)務(wù)的智能化改造。
其中,智能結(jié)構(gòu)化推理平臺用于訓(xùn)練產(chǎn)生針對各種不同版式的OCR識別引擎,自動從非結(jié)構(gòu)化數(shù)字信息中抽取目標(biāo)數(shù)據(jù),為識別平臺提供結(jié)構(gòu)化方法,一個版式3~5分鐘內(nèi)即可完成,可以賦予客戶自主解決80%以上的固定格式業(yè)務(wù)憑證的識別問題。
而其中的API接口平臺屬于API資源的一種,其可幫助技術(shù)領(lǐng)先企業(yè)開放AI能力與先進(jìn)資源,從而延伸價值鏈、構(gòu)造產(chǎn)業(yè)生態(tài),形成規(guī)模經(jīng)濟(jì)與長尾經(jīng)濟(jì),且利用開發(fā)者的創(chuàng)新應(yīng)用來反哺開放平臺;同時,其亦可在減輕基礎(chǔ)設(shè)施建設(shè)投入的條件下協(xié)助開發(fā)者打造自身產(chǎn)品或服務(wù),節(jié)省開發(fā)時間。
從總體上看,賽博學(xué)習(xí)平臺可提供較為前沿的技術(shù)、經(jīng)濟(jì)合理的模型生產(chǎn)經(jīng)驗以及為實現(xiàn)敏捷開發(fā)而打包的數(shù)據(jù)、算力與算法資源。具體而言,其采用自動機(jī)器學(xué)習(xí)技術(shù),很大程度上降低了機(jī)器學(xué)習(xí)的編程工作量、節(jié)約了AI開發(fā)時間、減輕了對專業(yè)數(shù)據(jù)科學(xué)家與算法工程師的依賴,讓缺乏機(jī)器學(xué)習(xí)經(jīng)驗的開發(fā)者用上AI,加快開發(fā)效率。
春風(fēng)化雨,把深度學(xué)習(xí)OCR帶給移動端
國內(nèi)首份OCR白皮書《智能文字識別(OCR)能力測評與應(yīng)用白皮書》中指出:大量的OCR應(yīng)用需要在資源受限的移動端設(shè)備上運(yùn)行,當(dāng)前移動端OCR算法大多以犧牲一定的算法精度來換取運(yùn)行速度,針對移動設(shè)備設(shè)計兼顧性能和效率的輕量OCR模型將是未來發(fā)展的重要方向。
早在去年,易道博識就察覺到了行業(yè)上的輕量級趨勢和需求,并在今年成功推出了移動端深度學(xué)習(xí)OCR ——DOM(,Deep OCR of Mobile),也就是手機(jī)端的深度學(xué)習(xí)OCR版本。
DOM是一款可以在移動端實現(xiàn)深度學(xué)習(xí)的OCR產(chǎn)品,可以支持在任意方向或角度以及苛刻背景條件下的超高速證件識別。DOM最大的特點(diǎn)體現(xiàn)在兩方面:高精度,輕量級。他可以10M左右的內(nèi)存環(huán)境,在保證高精度的前提下,深度學(xué)習(xí)的高速度優(yōu)勢完美展現(xiàn),在手機(jī)上實現(xiàn)了原來在服務(wù)端上才能支持的精度與速度。
相比傳統(tǒng) SDK 中基于四邊定位的的方法,深度學(xué)習(xí)的方法能夠更好地排除 背景噪聲的干擾,如存在背景線條或背景特征與證件接近的情況,從而可以得到更精確的證件輪廓信息。在識別能力上,基于深度學(xué)習(xí)技術(shù)的 DOM SDK識別核心具有大幅度領(lǐng)先的識別精度,具體表現(xiàn)在如生僻字、少數(shù)民族證件等場景下更好的識別效果。
DOM SDK的市場需求非常大,證券開戶,銀行開戶,投保理賠,汽車金融……等大量應(yīng)用卡證識別,且移動端需求量極大的業(yè)務(wù),都是DOM SDK的應(yīng)用場景。這些場景對識別速度、識別精度的要求非常高,客戶容忍度低,注重用戶體驗,對產(chǎn)品的魯棒性要求很高。
與人臉識別等其它識別任務(wù)不同,OCR技術(shù)不僅需要卷積神經(jīng)網(wǎng)絡(luò)(CNN),還需要更復(fù)雜、計算量更大的遞歸神經(jīng)網(wǎng)絡(luò)(RNN、LSTM),這需要強(qiáng)大算力為支撐,而手機(jī)并不像服務(wù)器端一樣擁有GPU。在不依賴算力和GPU的情況下,大幅度提升識別精度,顯著改善用戶體驗,這正是DOM SDK的技術(shù)價值所在。
潤物無聲,瞄準(zhǔn)市場風(fēng)口,賦能更多行業(yè)
道阻且長,行則將至。易道博識作為一名在AI路上已近10年的棋手,在賽博平臺和移動端OCR 無疑是兩手好棋。
首先,二者均從業(yè)務(wù)前端發(fā)掘潛在及外顯的市場需求,針對剛需應(yīng)用與高價值環(huán)節(jié)延伸出多條增量建設(shè)與運(yùn)行需求業(yè)務(wù)線,瞄準(zhǔn)市場風(fēng)口的同時,敏捷、經(jīng)濟(jì)地消化個性化和碎片化需求,根據(jù)需求柔性匹配生產(chǎn)。
而在兩手好棋的背后,易道博識也在構(gòu)筑自己的 “珍瓏棋局”。
從 2020 年至今,易道博識與華為建立了密切的合作關(guān)系。不僅與華為在產(chǎn)品上達(dá)成兼容,還基于各自領(lǐng)域的技術(shù)與資源優(yōu)勢,在解決方案層上積極探索實踐。其中,易道博識的Deep OCR技術(shù)為Atlas 800推理服務(wù)器提供了“每秒20張A4紙”量級的文本識別能力,因性能提高帶來的資源節(jié)省使得機(jī)房空間下降了60%,資源能耗下降了30%?,F(xiàn)已得到華為昇騰智能OCR解決方案的Compatible技術(shù)認(rèn)證證書。
并且今年,易道博識已經(jīng)和英特爾創(chuàng)新孵化器達(dá)成戰(zhàn)略合作,目前就產(chǎn)品研發(fā)和應(yīng)用上和英特爾的CPU技術(shù)框架進(jìn)行適配,目前階段性進(jìn)展順利,POC技術(shù)合作部分已取得了滿意的優(yōu)化結(jié)果,下一階段會逐步應(yīng)用到更多的產(chǎn)品類型上。