正文 二維條碼技術在檔案管理中的應用研究(2 / 3)

1.4 本文選擇PDF417碼

二維條碼有許多不同的編碼方法,本文決定采用PDF417碼作為檔案管理二維條碼技術應用軟件的碼製。主要原因是在公文係統中公文係統已使用PDF417碼。而許多機關也已購置了二維條碼掃描設備。為節約硬件、軟件投入,與公文係統保持一致,檔案部門也采用PDF417碼是合理的選擇。

1.5 二維條碼隻適合以件為整理單位的文書檔案

PDF417碼存儲空間雖然比一維條碼大得多,但也有限,隻有1K左右,而且存儲的信息越多,尺寸越大,不利於識讀器識別。所以二維條碼隻適合以件為整理單位的文書檔案,其信息較少,有可能存儲在二維條碼中。

1.5.1 以頁為單位存儲

電子文件以頁為單位,將每一頁的內容存儲在二維條碼中,附著在每一頁紙質文件上。這樣不但可以降低文件大小,而且有利於使用者隻選擇需要的頁進行掃描利用。

1.5.2 可采用宏PDF417碼

宏PDF417碼是一種變形的PDF417碼製形式,當文件內容太長,無法用一個PDF417碼表示時,可用包含多個(1—99999個)條形碼分塊的宏PDF417碼來表示。

2 研究內容

本文重點研究三個問題:根據二維條碼特點,選擇電子檔案應轉換為何種格式,製定《電子文件元數據二維條碼使用標準》,考慮文件形成部門、檔案館、檔案利用者的實際需求,設計二維條碼檔案管理軟件的功能。

2.1 電子檔案長期存取格式選擇

二維條碼一經產生,就不可更改,所以在生成前,先需將電子文件轉換為可長期存取的文件格式。本文選擇PDF文件格式。

2.2 製定《電子文件元數據二維條碼使用標準》

采用二維條碼作為電子檔案存儲與共享的載體,就必須對電子檔案數據進行標準化。檔案管理涉及的係統眾多,二維條碼起著在各係統間進行有效的數據交換的作用。隻有實現數據的標準化,才能真正實現信息共享和業務協同,電子檔案數據標準化已成為檔案管理中應用二維條碼的關鍵環節。在製定元數據標準時,應與已有的相應的國家標準保持一致。本標準直接使用《電子文件管理細則第一部分:文書電子文件元數據方案》,兼容文書部門所使用的《機關公文二維條碼使用標準》。

製定標準時,需要在通用與易用間取得平衡。二維條碼容量有其限製,所以存儲的元數據應盡可能簡練。從目前已經製定的國家標準中選取通用性、基礎性和共性的數據元素,作為本標準數據元素的主要內容。

本文設定電子檔案已經轉換為PDF格式了,可將電子簽名、文檔創建環境等無用數據元素去除。

將本標準的版本號暫定為“GB0626-2008”,幾按此標準生成的二維條碼,存儲的數據的前十一位必須是“GB0626-2008”。這樣在讀取數據時,就可按此規範轉換數據了。

本標準采取動態存儲方式,以…”作為數據元素的分隔符,以^|”作為條碼內容的結束符。這與《機關公文二維條碼使用標準》一致。

本標準在數據框架結構上借鑒了國家標準《GB/T20163-2006中國檔案機讀目錄格式》,把一條記錄劃分為四個區:記錄頭標、記錄目次區、數據字段區、記錄分隔符。

數據樣例如下:

GB0626-20080010004000000050004000064006000400009^文件^2008^永久^|

其中,前11個字節“GB0626-200}”是記錄頭標,表明遵循《電子文件元數據二維條碼使用標準》。從第12個字節到第一個“^”之間是記錄目次區,每12個字節是一個目次項。

001 0004 00000,005 0004 00006,006 0004000ll

00 1 0004 00000表示是編號為001的數據元素,數據長度為4,起始地址從“0”開始,起始地址就是第一個…”後。005 0004 00006表示是編號為005的數據元素,數據長度為4,起始地址從“6”開始;006 0004 00011表示是編號為001的數據元素,數據長度為4,起始地址從“11”開始。