紙質(zhì)圖書數(shù)字化加工
時間:2009-8-11 16:27:13 人氣指數(shù): 【 大 中 小 】
北京天潤智力專業(yè)從事紙質(zhì)文獻的數(shù)字化加工,將文獻資源制作成符合國際標準的數(shù)字資源,進行深度數(shù)據(jù)加工和加密處理,制作成全文檢索光盤供用戶使用,非常適合于圖書館、出版社、期刊雜志、各類企事業(yè)單位以及個人用戶。文檔整理
對原始文檔進行整理、拆分、分類,區(qū)分是否適合掃描,制定數(shù)字化方案。
圖書掃描
對特色圖書、期刊、論文進行篩選后進行掃描?梢圆捎酶咚賿呙鑳x進行快速圖像采集,也可以采用平板掃描儀進行不拆分掃描,生成TIFF、JPG、PDF等圖像格式。
影像處理
對掃描后的圖像增強處理,提高識別率和增強美觀度,如格式轉(zhuǎn)換、動態(tài)二值化處理、自動校正、自適應(yīng)紙張大小、灰度加強和去黑邊等功能。
文字識別
采用OCR軟件支持對掃描的圖像文件進行文字識別,生成文本文件。天潤智力采用國際領(lǐng)先的OCR識別技術(shù),既可以識別常見的簡體漢字、繁體漢字、英文,也可以識別日文、韓文、俄文、德文、法文等190多種文字,超強的版面分析能力,最大限度減少手工操作量,識別準確率高達99.8%。
格式轉(zhuǎn)換
轉(zhuǎn)換成雙層PDF格式,可以對圖像內(nèi)容進行全文檢索,檢索結(jié)果定位到文檔所在頁面的具體位置,文件內(nèi)容原版顯示,無須二次排版。
數(shù)據(jù)標引
對文檔的元數(shù)據(jù)進行標引;制作文檔目錄;在PDF中制作書簽鏈接,非常便于閱讀使用。
光盤發(fā)布
以全文檢索數(shù)據(jù)庫為核心,以HTML模版為界面,支持單字段(著錄項)簡單查詢,也能進行多字段多條件模糊檢索、二次檢索、復(fù)合檢索,還可以實現(xiàn)數(shù)據(jù)的導(dǎo)入導(dǎo)出、添加片頭片尾多媒體等多種功能。
數(shù)據(jù)加密
通過數(shù)字版權(quán)保護技術(shù)(DRM)將電子文檔進行加密處理,例如數(shù)據(jù)庫加密、文件加密、口令保護、軟件序列號認證、硬件加密等,有效保證數(shù)據(jù)安全。