明清檔案目錄中心數(shù)據(jù)采集標(biāo)準(zhǔn)
明清檔案機(jī)讀目錄數(shù)據(jù)交換格式
DA/T 33-2005
1范圍
本標(biāo)準(zhǔn)規(guī)定了軟磁盤、光盤等作為載體交換明清檔案機(jī)讀目錄數(shù)據(jù)時(shí)所使用的格式。
本標(biāo)準(zhǔn)規(guī)定的明清檔案機(jī)讀目錄數(shù)據(jù)文件的組織形式為交換格式的文本文件。
本標(biāo)準(zhǔn)適用于全國(guó)明清檔案目錄中心機(jī)讀目錄數(shù)據(jù)信息交換。
2規(guī)范性引用文件
下列文件中的條款通過本標(biāo)準(zhǔn)的引用而成為本標(biāo)準(zhǔn)的條款。凡是注日期的引用文件,其隨后所有的修改單(不包括勘誤的內(nèi)容)或修訂版均不適用于本標(biāo)準(zhǔn),然而,鼓勵(lì)根據(jù)本標(biāo)準(zhǔn)達(dá)成協(xié)議的各方研究是否可使用這些文件的最新版本。凡是不注日期的引用文件,其最新版本適用于本標(biāo)準(zhǔn)。
GB/T1988–1998信息技術(shù)信息交換用七位編碼字符集
GB/T2901–1992書目信息交換用磁帶格式
GB2312–1980信息交換用漢字編碼字符集基本集
GBl8030–2000信息技術(shù)信息交換用漢字編碼字符集
DA/T8–1994明清檔案著錄細(xì)則
3術(shù)語(yǔ)和定義
下列術(shù)語(yǔ)和定義適用于本標(biāo)準(zhǔn)。
3.1檔案目錄catalogue Of archives
按照一定的秩序編排而成的條目組合,是檔案管理、檢索和報(bào)道的工具。
3.2機(jī)讀目錄machine-readable catalogue
將檔案目錄按照一定格式輸入計(jì)算機(jī)內(nèi),可以由計(jì)算機(jī)讀取、管理、檢索的檔案目錄信息。
3.3數(shù)據(jù)data
對(duì)事物的概念和屬性進(jìn)行描述的規(guī)范化表示。
3.4記錄record
字段的集合,完整描述一件事物的相關(guān)數(shù)據(jù)處理單元。
3.5字段field
記錄中可標(biāo)識(shí)的特定范圍數(shù)據(jù),可包含一個(gè)或多個(gè)子字段
3.6子字段sub-field
字段的一部分,它含有一個(gè)確定的數(shù)據(jù)單元
3.7數(shù)據(jù)元素data="element
被明確標(biāo)識(shí)的最小數(shù)據(jù)信息單位
3.8字段標(biāo)識(shí)符tag
識(shí)別字段的一組三位數(shù)字符號(hào)。
3.9子字段標(biāo)識(shí)sub-field identifier
識(shí)別子字段的符號(hào),由(b~j)字母標(biāo)識(shí)。
3.10指示符indicator
字段標(biāo)識(shí)符后,提供有關(guān)字段內(nèi)容的附加信息。用(0–9)數(shù)字標(biāo)識(shí)
3.11分隔符separator
用來限定記錄、字段、數(shù)據(jù)單元的控制符。
記錄分隔符&,字段分隔符@,子字段標(biāo)識(shí)符$。
4交換格式的記錄構(gòu)成
4.1記錄結(jié)構(gòu)
記錄由一組按一定格式寫入的物理記錄序列構(gòu)成。
一條記錄由記錄頭標(biāo)、若干字段和記錄尾標(biāo)組成。
記錄頭標(biāo) | 字段1 | …… | …… | 字段N | 記錄尾標(biāo) |
記錄頭標(biāo)
標(biāo)識(shí)記錄的開始信息,由1位字符組成。
其取值,M代表明朝檔案,Q代表清朝檔案。
記錄尾標(biāo)
標(biāo)識(shí)記錄的結(jié)束信息,由1位字符組成。
其取值,“&”。
4.2字段結(jié)構(gòu)
記錄標(biāo)識(shí)符 | 指示符 | 字段標(biāo)識(shí)符(可選) | 數(shù)據(jù)區(qū) | 字段分隔符 |
3位字符 1位字符 2位字符 N位字符 1個(gè)字符
字段標(biāo)識(shí)符
標(biāo)識(shí)該字段數(shù)據(jù)區(qū)所屬的字段,其取值為三位數(shù)字。
指示符
標(biāo)識(shí)對(duì)應(yīng)字段的屬性。其取值為數(shù)字,空時(shí)為“#”。
子字段標(biāo)識(shí)符
由2位字符組成,標(biāo)識(shí)字段中所屬的子字段,
其第一位取值“$”。
第二位取值為小寫字母。
字段分隔符
指示該字段數(shù)據(jù)區(qū)結(jié)束。其取值為“@”。
4.3文件結(jié)構(gòu)
由若干記錄組成一個(gè)文件,文件起始處為說明記錄。
說明記錄 |
記錄 |
…… |
記錄 |
4.4字段標(biāo)識(shí)符說明
下列各字段定義除有專門說明外,均與DA/T8-1994相應(yīng)的著錄項(xiàng)的定義保持一致。
101 檔號(hào)
指示符為空
子字段表
標(biāo)識(shí)符內(nèi)容說明
$b 全宗號(hào)字段不可重復(fù)
$c 目錄號(hào)字段不可重復(fù)
$d 案卷號(hào)字段不可重復(fù)
$c 件號(hào)字段不可重復(fù)
$f 頁(yè)號(hào)字段不可重復(fù)
102 縮微號(hào)
指示符為空字段不可重復(fù)
103 檔案館代碼
指示符為空字段不可重復(fù)
104 電子文件號(hào)
指示符為空字段不可重復(fù)
105 畫幅數(shù)
指示符為空字段不可重復(fù)
106 密級(jí)
指示符為空字段不可重復(fù)
201 題名
指示符為空字段不可重復(fù)
202 責(zé)任者
指示符 1 表示第一責(zé)任者
指示符 2 表示第二責(zé)任者
指示符 3 表示第三責(zé)任者
子字段表
標(biāo)識(shí)符內(nèi)容說明
$b 官職爵位字段不可重復(fù)
$c 責(zé)任人字段不可重復(fù)
203 文本
指示符為空字段不可重復(fù)
204 時(shí)間
指示符 1 表示文件原紀(jì)年(明、清朝紀(jì)年)
指示符 2 表示公元紀(jì)年
指示符 3 表示外國(guó)紀(jì)年
子字段表
標(biāo)識(shí)符內(nèi)容說明
$b 文件起始時(shí)間字段不可重復(fù)
$c 文件終止時(shí)間字段不可重復(fù)
301 附注
指示符為空
子字段表
標(biāo)識(shí)符內(nèi)容說明
$b 責(zé)任者注字段不可重復(fù)
$c 載體型態(tài)字段不可重復(fù)
$d 檔案數(shù)量字段不可重復(fù)
$e 數(shù)量單位字段不可重復(fù)
$f 附件字段不可重復(fù)
$g 規(guī)格字段不可重復(fù)
$h 語(yǔ)種字段不可重復(fù)
$i 檔案實(shí)體字段不可重復(fù)
$j 時(shí)間注字段不可重復(fù)
601 主題詞
指示符為空
子字段表
標(biāo)識(shí)符內(nèi)容說明
$b 主表主題詞字段可重復(fù)
$c 人名主題詞字段可重復(fù)
$d 國(guó)家機(jī)構(gòu)主題詞字段可重復(fù)
$e 官職爵位主題詞字段可重復(fù)
$f 清代民族主題詞字段可重復(fù)
$g 行政區(qū)劃主題詞字段可重復(fù)
602 分類號(hào)
指示符 1 表示第一分類主號(hào)
指示符 2 表示第二分類主號(hào)
指示符 3 表示第三分類主號(hào)
子字段表
標(biāo)識(shí)符內(nèi)容說明
$b 分類主號(hào)字段不可重復(fù)
$c 地區(qū)復(fù)分號(hào)字段可重復(fù)
$d 民族復(fù)分號(hào)字段可重復(fù)
$e 國(guó)家復(fù)分號(hào)字段可重復(fù)
901 提要項(xiàng)
指示符為空字段不可重復(fù)
902 朝年政權(quán)標(biāo)識(shí)
指示符為空字段不可重復(fù)
903 控制符
指示符為空字段不可重復(fù)
5 XMLSchema模式定義
<schema> |
<element? name=“明清檔案目錄”> |
<complex? Type> |
<sequence> |
<element name=“檔案館代碼”type=“string'/> |
<element name=“全宗號(hào)”type=“string”/> |
<element name=“目錄號(hào)”type=“string”/> |
<element name=“案卷號(hào)”type=“string”/> |
<element name=“件號(hào)”type=“string”/> |
<element" name=“頁(yè)號(hào)”type=“string”/> |
<element name=“主分類號(hào)A”type=“string”/> |
<element name=“A地區(qū)1”type=“string”/> |
<element name=“A地區(qū)2”type=“string”/> |
<element name=“A地區(qū)3”type=“string”/> |
<element name=“A地區(qū)4”type=“string”/> |
<element name=“A地區(qū)5”type=“string”/> |
<element name=“A國(guó)家或民族l”type=“string”/> |
<element name=“A國(guó)家或民族2”type=“string”/> |
<element name=“A國(guó)家或民族3”type=“string”/> |
<element name=“A國(guó)家或民族4”type=“string”/> |
<element name=“A國(guó)家或民族5”type=“string”/> |
<element name=“主分類號(hào)B”type=“string”/> |
<element name=“B地區(qū)1”type=“string”/> |
<element name=“B地區(qū)2”type=“string”/> |
<element name=“B地區(qū)3”type=“string”/> |
<element name=“B地區(qū)4”type=“string”/> |
<element name=“B地區(qū)5”type=“string”/> |
<element name=“B國(guó)家或民族1”type=“string”/> |
<element name=“B國(guó)家或民族2”type=“string”/> |
<element name=“B國(guó)家或民族3”type=“string”/> |
<element name=“B國(guó)家或民族4”type=“string”/> |
<element name=“B國(guó)家或民族5”type=“string”/> |
<element name=“主分類號(hào)C”type=“string”/> |
<element name=“C地區(qū)1”type=“string”/> |
<element name=“C地區(qū)2”type=“string”/> |
<element name=“C地區(qū)3”type=“string”/> |
<element name=“C地區(qū)4”type=“string”/> |
<element name=“C地區(qū)5”type=“string”/> |
<element name=“C國(guó)家或民族1”type=“string”/> |
<element name=“C國(guó)家或民族2”type=“string”/> |
<element name=“C國(guó)家或民族3”type=“string”/> |
<element name=“C國(guó)家或民族4”type=“string”/> |
<element name=“C國(guó)家或民族5”type=“string”/> |
<element name=“責(zé)任者A”type=“string”/> |
<element name=“責(zé)任者B”type=“string”/> |
<element" name=“責(zé)任者C”type=“string”/> |
<element name=“責(zé)任者注”type=“string”/> |
<element name=“官職爵位A”type=“string”/> |
<element name=“官職爵位B”type=“string”/> |
<element name=“官職爵位C”type=“string”/> |
<element name=“題名”type=“string”/> |
<element name=“文本”type=“string”/> |
<element name=“原紀(jì)年起始時(shí)間”type=“string”/> |
<element name=“原紀(jì)年終止時(shí)間”type=“string”/> |
<element name=“公元紀(jì)年起始時(shí)間”type=“string”/> |
<element name=“公元紀(jì)年終止時(shí)間”type=“string”/> |
<element name=“外國(guó)紀(jì)年起始時(shí)間”type=“string”/> |
<element name=“外國(guó)紀(jì)年終止時(shí)間”type=“string”/> |
<element name=“主題詞”type=“string”/> |
<element name=“附注”type=“string”/> |
<element name=“提要項(xiàng)”type=“string”/> |
<element name=“檔案數(shù)量”type=“integer”/> |
<element name=“數(shù)量單位”type=“string”/> |
<element name=“檔案屬性”type=“string”/> |
<element name=“朝年政權(quán)標(biāo)識(shí)”type=“string”/> |
<element name=“控制符”type=“string”/> |
<clement name=“電于文件號(hào)”type=“string”/> |
<element name=“畫幅數(shù)”type="“integer”/> |
<element name=“密級(jí)”type=“string”/> |
</sequence></complex" Type></schema> |
6、文件數(shù)據(jù)字段映射表
序號(hào) | 字段名稱 | 字段類型 | 字段標(biāo)識(shí)符 |
1 | <檔案館代碼> | 字符 | 103 |
2 | <全宗號(hào)> | 字符 | 101$b |
3 | <目錄號(hào)> | 字符 | 101$c |
4 | <案卷號(hào)> | 字符 | 101$d |
5 | <件號(hào)> | 字符 | 101$c |
6 | <頁(yè)號(hào)> | 字符 | 101$f |
7 | <縮徽號(hào)> | 字符 | 102 |
8 | <主分類號(hào)A> | 字符 | 6021$b |
9 | <A地區(qū)1> | 字符 | 6021$c |
10 | <A地區(qū)2> | 字符 | 6021$c |
11 | <A地區(qū)3> | 字符 | 6021$c |
12 | <A地區(qū)4> | 字符 | 6021$c |
13 | <A地區(qū)5> | 字符 | 6021$c |
14 | <A民族1> | 字符 | 6021$d |
15 | <A民族2> | 字符 | 6021$d |
16 | <A民族3> | 字符 | 6021$d |
17 | <A民族4> | 字符 | 6021$d |
18 | <A民族5> | 字符 | 6021$d |
19 | <A國(guó)家1> | 字符 | 6021$e |
20 | <A國(guó)家2> | 字符 | 6021$e |
21 | <A國(guó)家3> | 字符 | 6021$e |
22 | <A國(guó)家4> | 字符 | 6021$e |
23 | <A國(guó)家5> | 字符 | 6021$e |
24 | <主分類號(hào)B> | 字符 | 6022$b |
25 | <B地區(qū)1> | 字符 | 6022$c |
26 | <B地區(qū)2> | 字符 | 6022$c |
27 | <B地區(qū)3> | 字符 | 6022$c |
28 | <B地區(qū)4> | 字符 | 6022$c |
29 | <D地區(qū)5> | 字符 | 6022$c |
30 | <B民族1> | 字符 | 6022$d |
31 | <B民族2> | 字符 | 6022$d |
32 | <B民族3> | 字符 | 6022$d |
33 | <D民族4> | 字符 | 6022$d |
34 | <B民族5> | 字符 | 6022$d |
35 | <B國(guó)家1> | 字符 | 6022$e |
36 | <B國(guó)家2> | 字符 | 6022$e |
37 | <B國(guó)家3> | 字符 | 6022$e |
38 | <B國(guó)家4> | 字符 | 6022$e |
39 | <B國(guó)家5> | 字符 | 6022$e |
40 | <主分類號(hào)C> | 字符 | 6023$b |
41 | <C地區(qū)1> | 字符 | 6023$c |
42 | <C地區(qū)2> | 字符 | 6023$c |
43 | <C地區(qū)3> | 字符 | 6023$c |
44 | <C地區(qū)4> | 字符 | 6023$c |
45 | <C地區(qū)5> | 字符 | 6023$c |
46 | <C民族1> | 字符 | 6023$d |
47 | <C民族2> | 字符 | 6023$d |
48 | <C民族3> | 字符 | 6023$d |
49 | <C民族4> | 字符 | 6023$d |
50 | <C民族5> | 字符 | 6023$d |
51 | <C國(guó)家1> | 字符 | 6023$e |
52 | <C國(guó)家2> | 字符 | 6023$e |
53 | <C國(guó)家3> | 字符 | 6023$e |
54 | <C國(guó)家4> | 字符 | 6023$e |
55 | <C國(guó)家5> | 字符 | 6023$e |
56 | <責(zé)任者A> | 漢字 | 2021$c |
57 | <責(zé)任者B> | 漢字 | 2022$c |
58 | <責(zé)任者C> | 漢字 | 2023$c |
59 | <責(zé)任者注> | 字符 | 301$b |
60 | <官職爵位A> | 漢字 | 2021$b |
61 | <官職爵位B> | 漢字 | 2022$b |
62 | <官職爵位C> | 漢字 | 2023$b |
63 | <題名> | 漢字 | 201 |
64 | <文本> | 漢字 | 203 |
65 | <語(yǔ)種> | 漢字 | 301$h |
66 | <原紀(jì)年起始時(shí)間> | 字符 | 2041$b |
67 | <原紀(jì)年終止時(shí)間> | 字符 | 2041$c |
68 | <公元紀(jì)年起始時(shí)間> | 字符 | 2042$b |
69 | <公元紀(jì)年終止時(shí)間> | 字符 | 2042$c |
70 | <外國(guó)紀(jì)年起始時(shí)間> | 字符 | 2043$b |
71 | <外國(guó)紀(jì)年終止時(shí)間> | 字符 | 2043$c |
72 | <主題詞> | 字符 | 601 |
73 | <附注> | 漢字 | 301 |
74 | <提要項(xiàng)> | 漢字 | 901 |
75 | <檔案數(shù)量> | 漢字 | 301$d |
76 | <數(shù)量單位> | 數(shù)字 | 301$e |
77 | <檔案屬性> | 字符 | 無標(biāo)識(shí)符,內(nèi)容為記錄頭標(biāo)信息 |
78 | <朝年政權(quán)標(biāo)識(shí)> | 字符 | 902 |
79 | <控制符> | 字符 | 903 |
80 | <電于文件號(hào)> | 字符 | 104 |
81 | <畫幅數(shù)> | 數(shù)字 | 105 |
82 | <密級(jí)> | 字符 | 106 |
實(shí)例:清代軍機(jī)處錄副奏折著錄條目
檔號(hào):0001–001
縮微號(hào):001–0015
文本:奏折
官職爵位A:都察院左副都御史
責(zé)任者A:二格
文件起始時(shí)間:061101026
題名:奏為請(qǐng)?jiān)O(shè)口外道員以專責(zé)成事
分類主號(hào)A:C111
A地區(qū)1:61
A地區(qū)2:62
記錄格式:
Q101#$d0001$e001@102#001-0015@201#奏為請(qǐng)?jiān)O(shè)口外道員以專責(zé)成事@2021$b都察院左副都御史$c二格@203#奏折@2041$b061101026@6021$bClll$c61$c62&