一門新學科的誕生
1941年抗日戰爭進入最艱苦的階段,在抗日根據地的掃盲工作中,我們曾經推廣過“新文字”(就是現在的漢語拚音)。那時,一小片一小片的根據地,還在日本侵略者的分割包圍之中,在根據地要用“新文字”代替使用了幾千年的漢字,其脫離實際的主觀程度,也真夠可以的了。可是,我們就是那個時候學會了漢語拚音的。
從“五四”運動開始,人們就認為方塊字難學,甚至把中國科學文化落後的罪狀,也強加在方塊字上。新中國建立之後,有許多文字改革家,仍然念念不忘使漢字“拚音化”。我國也曾在某些地區推行過“新文字”,但客觀是無情的,終究因為脫離實際和非科學的態度,推行失敗了。後來,“新文字”變成“漢字拚音”,成了學習漢字的輔助工具——這當然也是一件好事。
漢字到底是中華民族的優秀遺產還是因襲的曆史重擔,漢字是不是難學,中國科學文化的落後的罪狀,是不是應該加在漢字身上,許多專家已有定論。這且不言。我們認為漢字在統一中華民族方麵,是起了極其偉大的作用的。我們現在使用的漢語拚音,即漢語注音符號,隻能拚出普通話。如果拚廣東話(廣東又有客家語和海南語等)、福建話,那就要另外創造一種字母。那麼中國就不是一種文字和一種語言了(可能是數十種)。一個民族的重要特征,是語言文字的統一,如果漢族有多種文字,就很難說是一個民族了。所以說漢字在統一中華民族方麵起著偉大的無可代替的作用,是一點也不過分的。
我國到了80年代,電腦從國家機關、企事業單位,開始進入千家萬戶。為了輸入漢字,“新文字”又有了新“崗位”,人們最初使用的大多就是漢語拚音(即全拚碼),在還沒有發明“形碼”輸入方法的時候,有些人甚至認為拚音是電腦輸入漢字的方向。但用音碼(包括音形碼)有一個前提條件:要能講標準的普通話。從新中國建立,我國以政權和教育的力量推廣普通話,已近半個世紀。我們原來以就普通話已經很普及了呢,沒有想到,最近幾年跑過的不少方言地區,還得帶“翻譯”。不要說廣東、福建這樣的地方了,就是山西、山東、河南、河北都屬於講北方話的地區,發音就有很大區別。山西省的許多地方,把“銀子”說成“蠅子”,把“雁門關”說成“夜(雁)蒙(門)關”;江蘇省的南京、蘇州、泰州地區彼此用地方土語,互相也聽不懂。有些外地人在北京工作了幾十年,鄉音難改,還講不好普通話。鑒於這種方言土語的複雜情況,我們認為漢語拚音化的道路,從曆史觀點看,是脫離傳統的;從現實觀點看,是脫離實際的。因此在電腦迅速普及的今天,實現普及拚音和形碼輸入方法,除了他們的其他弱點之外(如重碼多等),僅從由於方言土語和人們“拚不準”這一角度看,用音碼方法,是很不樂觀的。方塊字有五千年的曆史,覆蓋了五千年的民族文化,想以拚音文字代替漢字為會割斷五千年的曆史,扔掉五千年的文化傳統。同時,漢字的發展是由“用、造、學、檢”四個子係統構成的大係統。而“造”是應“用”的要求而產生的。漢語拚音文字先“造、學”而後“用”,背離了漢字係統形成的順序,是不會成功的。因此,作為一個用戶,我們認為形碼比音碼的適應麵大得多。
1989年為了了解編碼信息,我們參加過一次全國性的電腦輸入比賽。隻那次參賽的編碼就有32種之多。賽後有一個“學術討論會”。我們作為一個用戶發了言:提出編碼要“科學、迅速、易學、難忘”的要求。發言之後,有好幾位編碼專家找我們,希望我們用他們的編碼,並免費提供軟件(為了不至於落下先入為主的印象,我們在發言中沒有說我們用的是表形碼)。“孩子是自己生的好”,所有向我們推薦他們發明編碼的專家,都向我們宣傳他們的編碼是如何如何優秀。因此,我們也研究、學習試用了幾種編碼,雖各有特長,但都不理想。到了1991年,據不完全的統計,發明的編碼已有五六百種之多了。我們在試用的一些編碼中發現:有不少編碼把漢字的字塊分拆得亂七八糟、五零七散,漢字的字塊麵臨被“肢解”的危險。我們想已經有了這麼多的編碼實踐,應該總結一下編碼的經驗,使實踐上升為理論。沒有理論的實踐,是盲目的實踐,混亂的實踐。所以那年我們在《中國科學報》上發表了題為《開展漢字編碼的理論研究》一文,建議編碼專家“從發明編碼的熱潮中走出來”,“從功利主義的目的中走出來”,“坐一坐理論研究的冷板凳”。我國使用了幾千年的漢字,在進入電腦時代的當前,麵臨著嚴重的挑戰,進行理論研究,無論對於我國的現代化,對於漢字教育,都有極為重要的意義。我們當時的信息不靈,早在1986年,陳愛文先生就出版了《漢字編碼的理論與實踐》的理論著作,我們是最近才看到的。陳愛文先生這本著作,為漢字編碼理論奠定了基礎。