“尚古匯典”專欄 | 獻禮讀書節 · “尚古匯典”OCR公測上線
全面免費開放個人版公測
獻禮讀書節,“尚古匯典·古籍數字服務平臺”,古籍OCR(個人版)公測全面上線,用戶可通過掃碼后,登錄平臺首頁領取200面額度的免費試用,并30天全平臺資源暢享VIP權限!!!

中國有幾千年的輝煌文明,在上下五千年的歷史長河中,傳承了非常多的珍貴古籍。這些古籍承載著豐富的歷史、文化、政治、經濟等方面的信息,具有非常重要的價值。據《中國古籍總目》統計,中國目前現存可知古籍數量大約有20萬種,50萬個版本。在古籍數字化迅速發展的今日,依然有大量的古籍沒有完成文字識別轉錄工作。
“尚古匯典·古籍數字服務平臺”所搭載的光學字符識別(OCR)技術工具,能高效助力我們精準識別古籍中的內容與文字,深入分析版面并支持版式信息結構性輸出。這對于古籍的保護、檢索工作,乃至信息的深入挖掘和知識發現,均具有重大意義。
“尚古匯典” 古籍OCR工具根據用戶的特色,設計了兩大版本:一為個人版,一為機構版。
尚古匯典” 古籍OCR工具個人版優勢
●建立在高質量、大規模的古籍標準化標注數據基礎上,對原版古籍數據進行了針對性訓練。版式和文字的平均識別準確率均達98%。

●行識別與字識別兩相對照,支持版式校正,以及原文與識別文字列對列逐字校正。


●支持識別文本結構性區分導出。
“
尚古匯典” 古籍OCR工具機構版優勢
在繼承OCR個人版優勢的同時,機構版更貼合實際項目管理需求,為機構用戶提供了更加全面、高效的文字識別體驗。
●?易錯字提醒:在高質量、大規模的古籍標準化標注數據基礎上,利用大數據算法,在OCR識別時將易錯字高亮提醒。

●?字聚類功能:支持在選定的文本范圍內,進行以識別字為單位的關聯字圖聚合,并支持實時修正。該功能通過同一字圖的統一聚類來進行識別。
●文本對比功能:在高質量、大規模的古籍標準化標注,以及古籍訓練的海量數據中,通過人工智能技術的相似文本篩選,支持識別結果比對驗證。
“尚古匯典·古籍數字服務平臺”將持續更新升級
歡迎長按以下二維碼,了解更多。

相關推薦