服務器處理數據帶來的另一個好處是,當服務器中數據庫引擎使用了緩衝機製時,多個工作站可以從中受益。例如,一用戶查詢一廠某數據,當另一用戶要查詢同樣的數據時,即可從服務器緩衝中直接得到結果,從而免去很多開銷。
客戶/服務器係統一般都是由一個公司開發的,因此在數據安全方麵都做得比較好,可以在客戶和服務器兩端都有較完整的保護措施。
客戶/服務器係統的成功與否在很大程度上依賴於服務器硬件質量和容量。用戶越多,服務器的處理負擔越重,相應服務器硬件性能也要跟得上,否則就會導致響應時間比本地型數據庫還要差的結果。
客戶/服務器的客戶端程序是要到客戶端逐個安裝的,當信息資源數據庫的規模和分散程度達到一定範圍時,客戶端的維護和升級將變成每個網絡管理員都十分頭疼的工作了。
2.瀏覽器/服務器型
這種結構在20世紀90年代末期開始盛行,隨著因特網瀏覽器功能越來越強大,在許多場合下,瀏覽器可以取代客戶機/服務器結構的客戶端軟件。在這種結構下,用戶界麵通過WWW瀏覽器獲得對信息數據庫的輸入、修改、查詢和數據刪除信息,而主要事務處理邏輯在服務器端實現。瀏覽器/服務器結構利用不斷成熟和普及的瀏覽器技術,實現原來需要複雜專用軟件才能實現的強大功能,並節約了開發成本,是一種全新的軟件係統構造技術。
本質上,瀏覽器/服務器也是一種客戶/服務器結構,它是一種由傳統的二層客戶/服務器結構發展而來的三層客戶/服務器結構在Web上應用的特例,即瀏覽器/Web/數據庫服務器的三級客戶服務器結構。三層的瀏覽器/服務器體係結構是把二層客戶/服務器結構的事務處理邏輯模塊從客戶機的任務中分離出來,由單獨組成的一層來負擔其任務,這樣客戶機的壓力大大減輕了,把負荷均衡地分配給了Web服務器,於是原來的兩層客戶/服務器結構轉變成三層瀏覽器/服務器結構。
瀏覽器/服務器體係結構由三個層次組成:客戶端瀏覽器(表示層)、Web服務器(功能層)和數據庫服務器(數據層)。表示層、功能層、數據層被割成三個相對獨立的單元:
第一層表示層:瀏覽器在表示層中包含係統的顯示邏輯,位於客戶端。它的任務是由瀏覽器向網絡上的某一Web服務器提出服務請求,Web服務器對用戶身份進行驗證後,用HTFP協議把所需的主頁傳送給客戶端,客戶機接受傳來的主頁文件,並把它顯示在Web瀏覽器上。
第二層功能層:具有應用程序擴展功能的Web服務器。在功能層中包含係統的事務處理邏輯,位於Web服務器端。它的任務是接受用戶的請求,首先需要執行相應的擴展應用程序與數據庫進行連接,通過SQL等方式向數據庫服務器提出數據處理申請,數據庫服務器將數據處理的結果提交給Web服務器,再由Web服務器傳送回客戶端。
第三層數據層:數據庫服務器在數據層中包含係統的數據處理邏輯,位於數據庫服務器端。它的任務是接受Web服務器對數據庫操縱的請求,實現對數據庫查詢、修改、更新等功能,把運行結果提交給Web服務器。
在瀏覽器/服務器的係統中,用戶可以通過瀏覽器向分布在網絡上的許多服務器發出請求。瀏覽器/服務器結構極大地簡化了客戶機的工作,客戶機上隻需安裝、配置少量的客戶端軟件即可,服務器將擔負更多的工作,對數據庫的訪問和應用程序的執行將在服務器上完成。
3.分布式服務器型
分布式服務器是針對一些超大型數據庫提出的工作方式。某些信息資源的信息量極大,如地理信息係統、全國人口戶籍信息係統等,無法在一個服務器的存儲單元中存放,並且也不可能在一地存放,因此必然需要利用分布式數據庫來協同完成。這樣的數據庫體係就成為分布式數據庫體係。在這個體係中,工作方式仍然是客戶/服務器或瀏覽器/服務器方式,但信息存取和服務器端的信息管理要比單一服務器係統複雜多了。
*+,%&;amp;-。/01234(567
計算機和網絡係統構成的信息係統的容量很大,運算速度很快,可以進行各種複雜的查詢統計分析工作,處理大量的業務。但它僅僅是工具。它完全按照人們編製的程序進行工作,隻能處理已經輸入進去,或者存儲在計算機裏麵的數據。它之所以能提供“應有盡有”的信息,是因為人們事先做了大量工作,編製了各種應用程序,輸入了大量的數據,進行了複雜的加工處理。之後才能根據用戶的要求,提供所需要的各種信息。要使信息資源庫正常工作,就不僅需要有一套完善的信息資源數據庫管理係統,而且要有一套保證信息數據庫可以經常更新和不斷發展的措施和製度來保障,這樣才能保證數據庫始終處於生命的活力區,不出現呆庫、死庫的局麵。這些措施包括了信息資源的采集、存儲與檢索、分析與挖掘及信息資源共享幾個方麵。
1.信息資源的采集
信息源就是信息的來源。我們要做工作的第一個目標就是要依據信息源的內容類別進行采集工作。信息源可分為五類:①自然信息源,自然界是最主要的自然信息源,舉凡大自然的延展分布和進化變遷等信息均可從大自然中獲取;②社會信息源,民間是最主要的社會信息源,我們可從民間獲取社會的組成結構、功能變化和發展態勢等方麵的信息;③經濟信息源,產業界是最主要的經濟信息源,我們可從產業界獲取產業結構、支柱產業、商品貿易和國民收入等方麵的信息;④科技信息源,學界是最主要的科技信息源,我們可從學界獲取科研力量及其分布、科研成果的積累與應用、科技與學術的發展走向等方麵的信息;⑤控製信息源,政府各部門是最主要的控製信息源,我們可以從政府各部門獲取政黨、軍隊、政體、政策和法律等方麵的信息。在信息采集的過程中,信息產生的最源頭的信息采集工作,應由產生這些信息資源的所在部門的有關人員完成。政府部門最主要的信息采集方式,是從獲得這些最初信息的部門或個人收集信息。如工商企業在進行企業注冊登記時,就要報出本企業的基本情況信息,工商管理部門則從中采集企業基本情況信息,並通過分類存儲過程形成企業信息資源。由於政府要麵對整個社會的各方麵,獲得如此繁多種類的信息,要使其形成信息資源,就必須各部門分別行動、各負其責,才可能保證采集到的信息的完整性、惟一性、真實性、連續性和權威性。如:人口戶籍信息一定要由人口所在地的公安部門采集;礦產資源的信息要由國土資源部門采集;企業基本情況要由工商管理部門采集;企業經營情況要由稅務、銀行和海關方麵采集等等。原因就是這些政府職能部門在工作中依據法律法規直接得到的這些信息,是符合完整性、惟一性、真實性和權威性的要求的。因此,明確信息資源采集部門,明確信息采集目標和任務及采集內容,是政務信息資源庫建設過程中進行信息采集時所必不可少的一項任務。否則,各行其是,重複采集,造成信息混亂,無法形成政務信息資源,將是必然的結果。
2.信息資源的存儲與檢索
信息存儲是有組織的信息的一種表現形式,是一種形成信息資源、使之可被重複利用的行為。信息存儲必須考慮兩方麵的因素:一是存儲介質的空間容量問題,無論人的大腦還是紙張、磁盤、圖書館建築或計算機網絡,其容量都是有限的,而信息存儲的根本問題,就是如何通過有效的信息組織高效率地利用有限的存儲空間;二是存儲信息的利用問題,信息存儲的最終目的是為人們的隨時利用提供方便,如僅考慮空間的集約,就可能妨礙人們對存儲信息的利用。因此在組織信息數據庫時,也要考慮大量政務信息如何存儲問題,如何可以方便地取用。因此,信息存儲不僅要有存儲空間,而且要有明確的存儲分類規則,便於按分類進行信息資源的組織和管理,保證信息資源可以得到有效的利用。
信息檢索是信息采集和存儲的反變換過程。信息采集和存儲的目的是將零散的信息組成一個有序的體係,信息檢索的目的則是迅速地從這個體係中搜尋用戶所需的信息。信息檢索方法依據不同標準可劃分為多種類型。對應於信息來源,信息檢索方法可分為事實(或效據)檢索方法、人名或機構名稱檢索方法、文獻檢索方法和信息資源體係(如檔案館館藏等)檢索方法等。對應於信息組織方法,信息檢索方法可分為字順(如題名、作者等)檢索方法、類號檢索方法、主題檢索方法、關鍵詞檢索方法和加權檢索方法等。由於計算機技術的發展,在計算機網絡上的信息量變得越來越大,政務信息的種類也越來越複雜,要保證檢索得到的不發生缺漏,一方麵需要做好信息存儲時的組織工作,充分利用網絡組織發展出的一係列解決方法,其中包括指導式服務、資源目錄、服務器注冊目錄、網絡目錄和電子圖書館等信息檢索方法。由於它們都具有更多的技術含量,是網絡環境中查詢信息的“領航員”,可以幫助我們很好地檢索分類信息。另一方麵也還要看到,高層政務信息是要從多類信息資源歸納檢索得到的,現有的信息檢索方式未必可以高效地得到所需信息,因此也需要注意研究新的檢索方式,使之與國家規定的信息交換用的Ⅻ4L語言格式更加匹配,提高信息調用的效率。
3.信息的分析與挖掘
用好信息資源,使其能夠為政務活動提供正確的依據和支持,則信息分析工作是必不可少的一部分。
信息分析是將概念化的用戶信息需求分解為各種簡單要素及其關係,然後分別進行研究,找出其中的主要因素及其關係,並以此為依據組織信息資源的方法。信息分析主要包括要素分析、實質分析、結構與功能分析和動態平衡分析等方法。
信息分析也是一種高層次的信息工作,它既不是純粹的學術研究活動,也不是純粹的政務處理活動,而是兩者的結合。通過信息分析工作可以進一步提高已有的信息資源的利用價值,為政府監管、政策製定和社會導向提供服務。通過信息分析可以得出:①綜述類信息,這類信息是通過信息采集後,對某一時期或某一專題的信息進行檢索、分析再予以歸納論述形成的。②述評類信息,是圍繞某一熱點問題或工作中的難點,在對大量的相關信息資源進行歸納綜述的基礎上,進一步做出評價和提出建議而形成的一種信息。③預測類信息,是在大量綜述和分析事物在某一時期或某一專題的相關信息資源的基礎上,找出其發展規律,並進而預測未來一段時間內的發展動向和趨勢而形成的一種信息。預測類信息主要包括各類預測、展望和趨勢分析等。可以看出,這三種一種比一種所包含的環節數多,智力含量大,其工作要求越複雜、越艱難,其價值也越大。
可見,保證高智力投入是確保信息產品質量和檔次的重要前提。再生型信息產品的生命周期比較短,用戶層次又比較高,需求量也比較小,這就要求信息分析必須注意速度和時效,及時地針對主要工作方向進行信息更新,不斷改善信息結構,提高信息檔次,盡可能地預測用戶將要產生的新的需求並為之服務。要實現這些目標,就必須聚集一流的開發人才和管理人才,組織力量聯合攻關,使這些信息達到和保持高質量。
數據挖掘是在信息資源建設中建立的大型數據庫或數據倉庫中提取人們感興趣的知識,這些知識是事先未知的潛在有用的信息,提取的知識表示為概念、規則、規律、模式等。也可以說,數據挖掘過程是在一些事實或觀察數據的集合中尋找模式的決策支持過程。其主要功能有:①自動預測趨勢和行為,數據挖掘在大型數據庫中尋找預測性信息,以往需要人工進行的大量分析工作可以迅速直接由數據庫本身得出結論。②關聯分析,數據關聯是數據庫中存在的一類重要的可被發現的知識。目的是找出數據庫中隱藏的關聯網,關聯分析生成的規則帶有可信度。③聚類,數據庫中的記錄可被劃分為一係列有意義的子集,即聚類。聚類增強了人們對客觀現實的認識,是概念描述和偏差分析的先決條件,以避免傳統技術的某些片麵性。④概念描述,概念描述就是對某些對象的內涵進行描述,並概括這類對象的有關特征。⑤偏差檢測,數據庫中的數據常有一些異常的紀錄,從數據庫中檢測這些偏差很有意義。基本方法就是尋找觀測結果與參照值之間有意義的差別。
實施數據挖掘要考慮:①使用數據挖掘解決什麼樣的問題;②是否已為此作了充分的數據準備;③使用何種算法解決問題。還應強調的是,數據挖掘似乎可以取代信息分析工作了,但我們必須看到,利用技術工具去完成工作隻不過是做工作的人的角色轉換,隻是對人的要求有所改變,但是對人的素質要求,對政務工作的了解程度及對數據分析的經驗一點沒有降低。因此,人的因素是第一位的,是做好信息資源建設工作不可改變的規律。
4.信息資源共享消滅信息孤島
電子政務要逐層次發展,就必須對政府數據庫進行科學的分類管理。從政府信息資源的性質來看,電子政務數據庫可分為:保密性信息;公益性信息,主要包括氣象、地震、水文、人口、自然資源等內容;商業性信息,包括商貿、投資、金融、科技、人才、企業、產品、娛樂等具有商業開發價值的信息。從數據可發布的對象來看,電子政務數據庫分為政府機構內部數據、政府機構共享數據和社會共享數據。
我國的信息資源建設是從20世紀80年代後期開始的,此時正處於經濟轉軌的初期,因此信息資源建設基本按照條塊分割的形式進行。電子政務數據庫主要是按照重點行業來劃分的,這種劃分在部門分割的基礎上形成,具有便於管理的特點,但是卻不利於信息共享。此後雖然對信息資源共享有了一定的認識,但由於沒有國家統一的法律法規,按部門按行業所需各自為政形成的信息數據庫,由於缺乏統一標準、統一的基礎數據庫,加上視信息資源為部門資產而占有之,基本上都成了無法實現信息共享的信息孤島。由於分不清哪些信息必須保密,哪些信息必須為社會共享,隨著信息化工作的發展還在不斷地有新的信息孤島產生。由於標準的不統一,係統平台的不一致,及組織機製上的問題也造成了許多低水平的重複投資、重複建設,許多數據庫自一建成起就成了軟庫、呆庫、死庫,對人力、物力、財力造成了極大的浪費。信息資源建設已成為我國電子政務發展的瓶頸和薄弱環節。
在國際上,一些發達國家信息化進程中也有過這樣的階段,但由於法製建設做得比較好,如美國的《信息自由法》和《文書工作縮減法》,使得信息資源的利用有了基本的定位。這也是這些國家能夠較快實現政務信息資源庫,能夠互聯互通共享的原因之一。因此,我國的政務信息化資源建設,應首先要使政務法製化建設和信息資源建設的技術工作同時進行,足夠重視信息工作的組織規劃標準建設這樣一類基礎工作,隻有在此基礎上發揮技術的作用,方能夠徹底地解決政府部門間信息共享,政府與全社會信息共享,消滅信息孤島的問題。
三、信息資源庫的建設
政務信息資源是電子政務的基礎,與網絡建設和業務係統建設相比,又處於相對滯後的狀態,需要以科學求實的態度,加快建設步伐。要實現跨越式發展就必須先打好發展的基礎,要從基礎抓起:編製國家政務信息資源建設規劃;建設若幹戰略性、宏觀性、基礎性、公益性國家級信息庫;搞好電子政務信息資源目錄體係與交換體係建設;建立政務信息分類標準、登記製度、交換製度;進行試點,形成有效的信息采集、登記、處理、交換、利用和發布機製。因此,政務信息資源建設絕不能搞一哄而起,到處點火遍地冒煙的花架子。要清醒地看到政務信息資源的弱點到底在哪裏,用實事求是的科學態度埋頭苦幹,方能見到應有的成效。
’()*+,-。/0123
信息資源庫的建設可以分成這樣幾步完成:①係統分析:研究用戶對信息係統的需求,明確要建的信息係統的目標和功能要求,編製信息係統的任務書。②係統設計:按照經過審訂的任務書,將信息係統的流程具體化、細化。例如,按照總的要求劃分子係統;按用戶的要求分析數據的各個組成部分,設計輸入和輸出的表格;按照功能的要求提出對信息係統的安全保護的技術規範和測試條件等等。③程序編製:按照係統設計的要求編寫程序,指揮計算機工作。④輸入數據:信息係統的基礎是數據。沒有數據的信息係統就像無水之渠。⑤係統調試:對信息係統進行分調和總調,解決各種技術問題,使之達到係統設計要求的各項指標,實現各項功能,使信息係統能夠正常運行。⑥測試和評價:按照係統設計的要求進行信息係統的測試。根據測試結果和試運行的實際情況進行信息係統的評價,分析信息係統的優點和缺點,提出改進的措施。
1.確定目標數據庫的功能和目標體係
信息資源建設首先要解決有什麼、在什麼地方、怎麼得到,如何形成高質量、方便管理、決策、服務使用的信息。這是對要建立的係統進行分析的第一步。信息資源是基本條件。如果信息資源很貧乏,或各信息資源管理很混亂,信息係統的建設就不具備必要的基礎,因而就需要結合管理對信息係統的建設進行整頓,開拓信息資源,加強管理,建立責任製,為信息係統的建設創造必要的基礎。
(1)建立信息資源庫的目的是解決信息管理問題
信息資源由信息源、信息服務和信息資源庫係統三大類構成。三者是互相聯係,互相融合的,很難絕對地劃分清楚。例如檔案管理數據庫,既可能是一項信息源,也可能是一項查詢服務,又可能是一項信息管理係統。對這三者重要的不是簡單地區分它們的不同,而是把握三者所綜合包含的內容,掌握其共性中所體現的信息資源的含意。我們應明確看到,實現信息共享,使信息資源可以為各級政府部門和社會公眾提供服務,是信息資源建設的最終目的。建立信息係統,收集信息資源,都是為了實現信息服務的目標。提供組織所需要的信息內容,這是信息資源管理的出發點和歸宿。
上述三者的聯係可以用一個三角形表示。信息共享和服務居於三角形的頂端,服務是目的,信息源居於三角形的一個底角。信息源代表有關信息的資源,信息的渠道,或可能取得信息的任何來源。信息資源庫係統居於三角形的另一個角。信息資源庫係統是按照信息服務的要求,將信息資源進行處理的方法和工具,實現信息的有序化,使信息的流動得到有效的控製。這樣我們就可以看出,利用先進的技術手段,搞好信息資源庫建設的目的,還是要搞好信息資源的管理,使信息資源能更好地為政府和全社會有效利用。
(2)要明確信息資源庫的目標體係和功能
明確了信息資源庫建設要為提供信息服務的目的,就要明確建立的信息資源庫的目標體係和有哪些功能的問題。在當前政務信息化過程中,這個問題更是首當其衝。我國以往建立的各種數據庫數量不少但質量不高,數據庫建設雖然是以政府行為為主體,但卻又缺少整體的規劃和各建庫機構間的分工合作與協調。建成的數據庫總量不少,但有許多是重複建設的自用小庫,數據庫本身的使用價值、數據庫的建設與數據庫的應用嚴重脫節。現存數據庫存在著嚴重的質量問題。一些數據庫的結構不合理,如:有的數據難以應用,有的重要數據想用又找不著,數據庫之間因標準化程度低,無法互聯互通等。因此,做政務信息資源庫首先就要考慮好信息資源庫的定位,如是否為中央政府所規定的基礎信息資源庫,還是這個庫的一個子庫,或者是否屬於規劃中的業務資源信息係統或這個係統的一部分,或為本地區的公眾服務信息資源庫。有了目標體係方能知道要建的信息資源數據庫與上下左右的關係,統一標準,統一建設規範,避免重複建設,解決信息資源不足和信息不能互通的問題。在此基礎上再明確數據庫的功能,如是僅供信息查詢檢索,還是作決策支持或者作統計分析用。有了明確的功能才能明確係統的支持平台,確保運行效率。