3月20日至21日,“華為中國合作伙伴大會2025”在深圳盛大舉行。本次大會以“因聚而生,眾智有為”為主題,匯聚了來自五湖四海的行業(yè)翹楚、企業(yè)精英與技術(shù)專家,共同探討如何攜手并進,共謀人工智能發(fā)展。作為華為昇騰生態(tài)合作伙伴,易道博識攜產(chǎn)品亮相本次盛會,現(xiàn)場展示適配華為昇騰芯片的大模型OCR解決方案。
近年來,數(shù)據(jù)已成為核心生產(chǎn)要素,而文檔作為數(shù)據(jù)的重要載體,其智能化處理能力直接關(guān)系到企業(yè)的運營效率和決策水平。尤其是在金融行業(yè),海量的業(yè)務(wù)文檔,如合同、報表、憑證、證件等,構(gòu)成了金融機構(gòu)日常運營的血脈。如何高效、精準(zhǔn)地處理這些海量文檔,從中提取關(guān)鍵信息,并將其轉(zhuǎn)化為可供業(yè)務(wù)系統(tǒng)使用的結(jié)構(gòu)化數(shù)據(jù),成為了金融機構(gòu)數(shù)字化轉(zhuǎn)型的關(guān)鍵挑戰(zhàn)。
傳統(tǒng)的OCR在處理結(jié)構(gòu)化文檔和印刷體文檔方面已經(jīng)取得了顯著的成果,但在面對新版式、復(fù)雜版式文檔等場景時,識別精度往往難以滿足實際業(yè)務(wù)需求。此外,傳統(tǒng)OCR系統(tǒng)通常需要針對不同的文檔類型進行模型定制和訓(xùn)練,開發(fā)周期長、成本高昂,難以適應(yīng)快速變化的業(yè)務(wù)需求。
而隨著以Transformer架構(gòu)為代表的大模型的興起,文檔處理也迎來了新的發(fā)展機遇。大模型技術(shù)憑借其強大的語義理解能力、跨模態(tài)學(xué)習(xí)能力和泛化能力,能夠有效克服傳統(tǒng)OCR技術(shù)的局限性,實現(xiàn)對各種復(fù)雜場景文檔的高精度、高效率識別和處理。易道博識正是敏銳地洞察到了大模型在文檔智能領(lǐng)域的巨大潛力,推出了GIE大模型(OCR大模型)。
金融機構(gòu)只需通過一個API接口,即可實現(xiàn)幾乎所有金融業(yè)務(wù)場景涉及的文檔類型的高精度識別,如財務(wù)發(fā)票、合同文本、法律文件、審計報告、理賠文件、項目文件、企業(yè)文檔、醫(yī)療單據(jù)、財務(wù)報表、個人證件、機構(gòu)證件、保險單據(jù)、訂單表單等。
這極大地簡化了系統(tǒng)集成和部署流程,降低了開發(fā)成本,讓金融機構(gòu)能夠快速、便捷地享受到大模型帶來的智能化升級紅利。
例如在以往兩錄一校業(yè)務(wù)中,同一筆文檔數(shù)據(jù)需要由兩名不同的操作人員分別獨立錄入,由第三人對上述兩人錄入的數(shù)據(jù)進行核對校驗,確保兩次錄入的數(shù)據(jù)一致。易道博識智能兩錄一校方案,方案采用GIE大模型和OCR小模型同時對一份文檔進行整張識別錄入,系統(tǒng)智能比對識別結(jié)果,大部分一致數(shù)據(jù)自動化入庫,少量不一致則交由人工審核核驗。 交叉校驗構(gòu)建數(shù)據(jù)質(zhì)量防線,大幅提升業(yè)務(wù)效率。
易道博識與華為始終保持緊密的戰(zhàn)略伙伴關(guān)系,共同致力于驅(qū)動金融行業(yè)的數(shù)智化轉(zhuǎn)型升級,易道博識也期待以此為契機,與華為及更多生態(tài)伙伴深化交流,拓展合作,共譜智能金融自主創(chuàng)新發(fā)展的新篇章。