(試行)
本規(guī)定對紙質(zhì)檔案數(shù)字化的工作流程提出具體的技術(shù)要求,適用于檔案館(室)紙質(zhì)檔案的數(shù)字化加工、驗收及數(shù)據(jù)管理。
本規(guī)定依據(jù)國家行業(yè)標準 DA/T 31—2005《紙質(zhì)檔案數(shù)字化技術(shù)規(guī)范》而制定。
1 紙質(zhì)檔案數(shù)字化基本要求
1.1 加工范圍
檔案數(shù)字化加工的范圍為永久或長期保存的、社會利用價值高的檔案。
1.2 基本環(huán)節(jié)
紙質(zhì)檔案數(shù)字化的基本環(huán)節(jié)為:檔案整理、檔案掃描、圖像處理、圖像存儲、目錄建庫、數(shù)據(jù)掛接、數(shù)據(jù)驗收、數(shù)據(jù)備份、數(shù)據(jù)管理等。
1.3 過程管理
1.31 建立檔案數(shù)字化加工安全保密管理制度,確保檔案原件和數(shù)字化檔案信息的安全。
1.32 建立檔案數(shù)字化的臺帳制度,在檔案數(shù)字化各環(huán)節(jié)均進行詳細登記,以備查考。
2 檔案整理
在檔案進行數(shù)字化掃描前,應對檔案進行整理,確保檔案數(shù)字化質(zhì)量。
2.1 目錄審核
目錄審核是根據(jù)檔案的實際情況,按照《檔案著錄規(guī)則》(DA/T 18)等要求,規(guī)范檔案目錄著錄內(nèi)容,核實目錄的準確性。如有不規(guī)范或錯誤的文件題名、責任者、檔號、起止頁號和頁數(shù)等,應對目錄進行修改,為建立目錄數(shù)據(jù)庫做準備;已建立目錄數(shù)據(jù)庫的,則依據(jù)檔案實體對目錄數(shù)據(jù)進行檢查核實和修改。
2.2 鑒定掃描件和非掃描件
制定掃描件和非掃描件的范圍,按要求把同一案卷中的掃描件和非掃描件區(qū)分開。原則上重份文件、有正文的底稿或檔案經(jīng)過鑒定后不列入掃描范圍的屬于非掃描件。
2.3 拆件和裝訂
以不損傷檔案原件為前提,盡量拆除檔案裝訂物,以免影響掃描質(zhì)量。如拆除裝訂物可能會對檔案原件造成損傷的,應保持原裝訂。
掃描工作完成后,應進行檔案清點,做到準確、無遺漏;拆除過裝訂物的檔案應按原檔案卷內(nèi)文件的排列順序進行排列,恢復裝訂,或根據(jù)工作需要改變原裝訂方法。
2.4 頁面修整
對已確定掃描的檔案進行頁面情況檢查,頁面破損嚴重,無法直接進行掃描的,應先進行頁面修復;頁面折皺不平,影響掃描質(zhì)量的,應先壓平或熨平后再進行掃描。
2.5 檔案整理登記
制作檔案整理工作登記表,對檔案整理的過程一一進行登記,包括目錄審核修改情況,掃描件和非掃描件鑒定情況,頁面修整情況等,作為數(shù)字化其他工作環(huán)節(jié)的依據(jù)(登記表格參見附表A)。
3 檔案掃描
3.1 掃描方式
3.2 掃描色彩模式
3.3 掃描分辨率
3.4 掃描登記
登記掃描檔案的頁數(shù)、色彩模式、分辨率等,如需要進行OCR識別的檔案應注明。在登記的同時應注意核對每份文件的實際掃描頁數(shù)與檔案整理登記單填寫掃描件的頁數(shù)是否一致,發(fā)現(xiàn)漏掃或錯掃時應及時補掃,并在登記表上注明原因和處理方法(登記表格參見附表A)。
4. 圖像處理
4.1 圖像質(zhì)量檢查
4.2 糾偏
對出現(xiàn)偏斜的圖像應進行糾偏處理,以達到視覺上不感覺偏斜為準。對方向不正確的圖像進行旋轉(zhuǎn)還原,以符合閱讀習慣。
4.3 去污
對圖像頁面中出現(xiàn)的影響圖像質(zhì)量的雜質(zhì),如黑點、黑線、黑框、黑邊等應進行去污處理,在不影響文字可懂度的前提下展現(xiàn)檔案原貌。
4.4 圖像拼接
對大幅面檔案采用分區(qū)小幅面掃描后,形成的多幅圖像,應進行拼接處理,合成為一個完整的圖像,拼接后應與檔案原件核實,確保拼接無誤,保證數(shù)字化圖像的整體性。
4.5 裁邊
為縮小圖像文件容量,節(jié)省存儲空間,掃描的圖像應去除圖像無內(nèi)容、多余的邊。
5 圖像存儲
5.1 圖像存儲格式
5.2 圖像文件的命名
全宗號3位、目錄號3位、案卷號4位、文件所在頁號4位、文件順序號(件號)4位、年度4位、類別(機構(gòu))代碼2位、歸檔號4位、一級類目代號1位、二級以上類目代號2位。
檔號中空缺或沒有進行編制的號(代碼),如全宗號、類別(機構(gòu))代碼等,則以“0”替之。
6 目錄建庫
6.1 數(shù)據(jù)格式
選擇通用的數(shù)據(jù)格式(DBF、TXT、MDB),能直接或間接地通過XML文檔進行數(shù)據(jù)交換。
6.2 檔案著錄
按照《檔案著錄規(guī)則》(DA/T 18)、《廣西文件級檔案目錄數(shù)據(jù)采集方案》等要求進行著錄,建立規(guī)范檔案目錄數(shù)據(jù)庫。
6.3 目錄數(shù)據(jù)質(zhì)量檢查
質(zhì)量檢查可采用人工抽查或軟件自動校對等方式,核對著錄項目是否完整、著錄內(nèi)容是否規(guī)范、準確。為了保證目錄數(shù)據(jù)與圖像文件能夠正確掛接,檢查時要重點檢查檔號是否準確、錄入的數(shù)據(jù)條目數(shù)與檔案的實際數(shù)量是否一致,發(fā)現(xiàn)數(shù)據(jù)錯錄、漏錄應及時進行修改、補錄。
7 數(shù)據(jù)掛接
7.1 匯總掛接
檔案數(shù)字化后形成的圖像數(shù)據(jù)庫,經(jīng)過質(zhì)量檢查確認合格后,通過相應的軟件與檔案文件目錄數(shù)據(jù)庫進行批量掛接。
7.2 檢查掛接
數(shù)據(jù)掛接后,以檔案文件級目錄數(shù)據(jù)庫為依據(jù),對掛接的圖像文件進行檢查,核對圖像文件的命名格式是否符合要求,發(fā)現(xiàn)錯誤及時作出修正。
7.3 掛接登記
對匯總掛接及檢查掛接的情況進行登記,對掛接錯誤的注明錯誤原因、處理辦法及修正結(jié)果(登記表格參見附表B)。
8 數(shù)據(jù)驗收
8.1 數(shù)據(jù)抽查
8.2 驗收指標
合格率=抽查合格的文件數(shù)/抽查文件總數(shù)×100%。
8.3 驗收審核
驗收“通過”的結(jié)論,必須經(jīng)過分管領(lǐng)導審核、簽字后才有效。
8.4 驗收登記
對驗收過程進行詳細登記,以備查考(登記表格參見附表B)。
9 數(shù)據(jù)備份
9.1 備份要求
每星期形成的圖像文件數(shù)據(jù),除備份在計算機硬盤外,并采用一次性寫入光盤刻錄一套數(shù)據(jù)保存。
9.2 數(shù)據(jù)檢驗
備份的數(shù)據(jù)應進行檢驗,檢查備份數(shù)據(jù)是否能被計算機正確讀取、數(shù)據(jù)信息是否完整、文件數(shù)量是否準確等。
9.3 備份標簽
數(shù)據(jù)備份后應在相應的備份介質(zhì)上做好標簽,并簡略說明備份內(nèi)容和備份時間,以便查找和管理。
9.4 備份登記
對每次備份的內(nèi)容、數(shù)據(jù)大小、備份時間、備份套數(shù)及數(shù)據(jù)存放位置等進行記錄(登記表格參見附表C)。
10 數(shù)據(jù)管理
10.1 管理要求
加強對紙質(zhì)檔案數(shù)字化成果的管理,制定相應的管理制度,對備份數(shù)據(jù)定期檢查,確保數(shù)據(jù)的安全、完整和長期可用。
10.2 保管環(huán)境
10.3 檢測與維護