国产啪精品成人免费视频,国内欧美一区二区精品,成人一区二区三区免费观看视频

古籍文獻(xiàn)全文數(shù)字化

時(shí)間：2009-8-11 16:27:13 人氣指數(shù)：【大中小】

北京天潤(rùn)智力專業(yè)從事紙質(zhì)文獻(xiàn)的數(shù)字化加工，將文獻(xiàn)資源制作成符合國(guó)際標(biāo)準(zhǔn)的數(shù)字資源，進(jìn)行深度數(shù)據(jù)加工和加密處理，制作成全文檢索光盤供用戶使用，非常適合于圖書館、出版社、期刊雜志、各類企事業(yè)單位以及個(gè)人用戶。

古籍全文數(shù)據(jù)庫(kù)

對(duì)古籍資源的全文進(jìn)行數(shù)字化處理，為讀者提供全文閱讀、全文檢索或智能分析服務(wù)。根據(jù)全文數(shù)字化的技術(shù)處理情況，可以將其分為圖像版、文字版、圖文版。對(duì)圖像的掃描處理我們一般采用JPEG、TIFF格式，經(jīng)過OCR識(shí)別、人工校對(duì)后生成可以全文檢索的雙層PDF文件，既便于用戶閱讀、檢索，又便于數(shù)據(jù)共享和傳輸。

1、手工錄入：

將古籍的全文以鍵盤輸入計(jì)算機(jī)，使之?dāng)?shù)字化。經(jīng)過標(biāo)引及系統(tǒng)處理，凡錄入的文字都可以檢索、統(tǒng)計(jì)，貯存空間小，檢索速度快。同時(shí)，為了保證文字的準(zhǔn)確率，我們開發(fā)了古籍自動(dòng)�？毕到y(tǒng)，對(duì)錄入后的文本進(jìn)行自動(dòng)校對(duì)，并采用人工輔助校對(duì)的方式，經(jīng)過3~5個(gè)校次，文字錯(cuò)誤率控制在萬(wàn)分之一以內(nèi)，達(dá)到出版水平。

2、圖像掃描：

保存古籍文獻(xiàn)的電子影像，用掃描儀等將古籍文獻(xiàn)的文字(包括圖表)以圖像形式進(jìn)行存儲(chǔ)。存儲(chǔ)為國(guó)際通用的PDF格式，版式保留完整，文字不會(huì)產(chǎn)生錯(cuò)誤，且能保證文獻(xiàn)的原始狀態(tài)，同時(shí)圖像文件經(jīng)過技術(shù)處理后，能以較小的貯存空間存儲(chǔ)。

3、雙層PDF圖文格式：

用掃描方式制成TIFF圖像，然后利用OCR技術(shù)將圖像形式全部識(shí)別為可檢索的漢字，并將文字和圖像進(jìn)行對(duì)應(yīng)，制作成圖像在上、文字在下的雙層PDF格式文件。既便于用戶快速準(zhǔn)確地查找到所需內(nèi)容，又能使用戶古籍的原始面貌。雙層PDF特別適合于古籍?dāng)?shù)字化，異寫、通假、避諱等造成的眾多漢字無(wú)法完全識(shí)別，用戶通過圖像即可對(duì)照。

古籍書目數(shù)據(jù)庫(kù)

以書目?jī)?nèi)容為數(shù)字化對(duì)象，對(duì)古籍的元數(shù)據(jù)描述，內(nèi)容包括書名、責(zé)任者、版本、卷數(shù)、刻印年代、藏地、版式等情況，形成機(jī)讀目錄格式，向用戶提供結(jié)果查詢。

韩国三级电影精品久久-国产精品成年片在线观看-亚洲精品一区二区在线视频-国产男女搞视频免费看