實際上,電子文件的產生和繁榮、紙質文件的逐漸衰落,本身就是一個時代信息載體發生變化的憑證,我們也不能簡單地認為後於電子文件產生的紙質文件在憑證作用上比電子文件更有優勢,兩者的對立、並存身後隱藏著錯綜複雜的時代因素和事物發展本身的規律。這種錯綜複雜的狀況本身,就應該作為一種時代特征在檔案中留存下來,而不是以現有規範去規整之,抹殺之,這不啻為一種異化。
4“大數據”的啟示
在檔案規範這個方麵,“異化”遠沒有作為現代性特征之一的“異化”來得這麼複雜。這其中涉及的可能隻是一種工作思路的拓寬和思維方式的轉變。
在這裏,同樣是處理信息的“大數據”思維方式或許能夠為我們提供新的思考路向。“大數據”是一種“需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產”。[4]這種“新的處理模式”就是本文所說的“大數據的啟示”。“大數據”對思維方式的變革主要有三方麵內容。
第一,大數據分析的是所有數據,而非樣本數據。以往由於數據收集手段和處理手段的限製,人們往往用隨機采樣的方法來得出總體性的結論,這種方法依賴的是“確定的隨機性”,“確定的隨機性”這種提法本身就是一個悖論,一旦這種隨機性不那麼確定,分析結果就會謬以千裏。這就同我們狹義上的檔案相類似,具體來說,我們憑什麼認為字跡能夠保存下來的文件才是真實的,而字跡發生褪變的文件就應排除在外呢?在全數據模式下,樣本同總體畫上了等號,“通過使用所有的數據,我們可以發現如若不然則會在大量數據中淹沒掉的情況”。[5]以這樣的方式來比照檔案,我們是否也能發現被狹義檔案所遮蔽的曆史真實呢?
第二,大數據著眼的是混雜性,而非精確性。精確性是對“小數據”最基本的要求,在數據量本身就很小的前提下,精確的數據才能被認為是有效的數據。但在大數據時代,混雜性甚至被看作了一種“標準途徑”,[6]在一個標準下被認為是不精確的數據,或許在另一個標準下有著截然不同的重要性。檔案規範恰恰無法容忍混雜性,在信息缺乏時代,檔案管理機構必須保證每一份進館的文件是“精確”的,似乎隻有這樣才能在利用的時候保證是對曆史原貌的還原,如此還衍射到了許多細枝末節的“精確”點(比如頁碼)。但是在大數據的思路下,問題的重點並不在於數量是否精確,而在於處理這些數據的手段是否有效,也就是說,並不在於“檔案”是否精確,而在於利用者以何種手段來利用。在信息化條件下,能夠進行任意字段的檢索,絕不會出現因數據量巨大無法查找的情況,並且能夠根據不同的搜索方式,自動歸納新的字段,使得檔案管理係統“活”起來,這才是大數據思路下檔案信息化的本質功用之所在。
第三,大數據呈現的是相關關係,而非因果關係。這種思維方式和福柯在《知識考古學》中的觀點不謀而合,知識考古學不考察事件變化的因果關係,而著眼於變化發生的外部條件,並由這些外部條件,重新構建一個更為宏大的、複雜的曆史網絡。以這個思路來考察“雙套製”問題,我們就不應再以規範的要求來“改造”電子文件,把電子文件硬塞入既有的因果關係中。各類檔案規範應該在持守檔案本質的同時,放開胸襟,以更寬容的姿態接納“所有數據”,認可“混雜性”,呈現更為寬闊、複雜的曆史原貌。進一步來說,以“相關性”來分析巨量的檔案數據,檔案就具備了預測功能,這又為檔案管理機構從文件管理向知識管理提供了契機。
當規範對檔案管理產生異化的作用,使得作為檔案存在意義的真實性都走向了反麵之時,我們是應該故步自封,還是應該與時俱進,這個答案是不言自明的。我們或許能夠將檔案的本質和應守的規範分為包裹著的內外兩層,內中方方正正的是檔案的本質,所謂“守史”,外部的規範卻需要打磨得圓潤,以和曆史的發展相契合,以規範的圓融變通才能守衛本質的剛正不阿,而不應將規範當做一把砍斧,將曆史掐頭去尾,修改規整後才將其稱為“檔案”。以這種“外圓內方”的方式來持守檔案的本質,或許能使檔案在現時中以一種豐富的麵貌獲得社會的認可,在曆時中以一種寬容的態度成為曆史的見證。
圖:常用墨水耐水性測試
參考文獻:
[1]中華人民共和國檔案法.1987年9月5日第六屆全國人民代表大會常務委員會第二十二次會議通過.
[2]民政部歸檔文件整理辦法.民辦發[2002]6號.
[3]中華人民共和國行業標準歸檔文件整理規則(DA/T22-2000).2001年1月1日實施.
[4]楊旭,湯海京,丁剛毅.數據科學導論[M]:北京理工大學出版社,2014:9.
[5][6]維克托·邁爾-舍恩伯格,肯尼斯·庫克耶著.大數據時代[M].盛楊燕,周濤譯,浙江人民出版社,2012:38,58.
(作者單位:上海大學檔案館來稿日期:2015-04-16)