6.3.1 係統開發
與i-GIDSSG的開發平台保持一致,CMTIDSS也采用Visía1 Stidio。NET 2005開發,我們先用。NET開發出係統的主體界麵和係統管理模塊,然後分別采用i-GIDSSG中的PMS-DC、KMS-DC、MMS-DC和DMS-DC開發係統的問題管理、知識管理、模型管理和數據管理模塊。
由於采用組件式開發,係統的核心模塊開發非常簡單,隻需將各組件在Visía1 Stidio。NET 2005平台上添加到係統開發工程中,再對其中需要使用的組件對象的屬性進行設置,並對必要的接口事件進行少量的編程,即可完成係統中這些模塊的開發。
CMTIDSS的係統界麵。
6.3.2 決策問題分析過程
CMTIDSS的主要功能是解決我國固體礦產業技術創新體係建設所涉及的決策問題。根據課題的研究,總結出需要由係統處理的決策問題主要有三個:
問題1:九五和十五期間,我國固體礦產業各年的技術創新綜合水平如何?
問題2:九五和十五期間,影響我國固體礦產業技術創新綜合水平的各因素中,最主要的因素是哪些?
問題3:九五和十五期間,影響我國固體礦產業技術創新綜合水平的各因素對技術創新體係各方麵績效的影響程度怎樣?
通過這三個問題的分析求解,即可對我國固體礦產業技術創新體係的建設目標、建設重點以及相關政策調整的決策提供重要的支持。
下麵,我們根據本書提出的問題處理方法給出在CMTIDSS中對這三個問題的分析過程。
1.問題1分析過程
根據第三章提出的問題智能識別機製和第四章的問題智能識別模型,我們將PMS中的問題分析歸結為五步分析過程:
第一步,問題表述語句的輸入。
問題1的中文表述為:
九五和十五期間,我國固體礦產業各年的技術創新綜合水平如何?
第二步,問題的表層屬性的識別。
首先,利用中文分詞係統(我們在PMS-DC中選用中國科學院計算技術研究所研製的中文自然語言處理開放平台——基於多層隱馬模型的漢語詞法分析係統ICTCLAS,該係統在2002年的é73專家組評測中獲得第一名,並在2003年的Bakeoff比賽中取得較突出的成績)對問題表述語句進行分詞,分詞並經過適當的組詞後結果如下:
九五/和/十五/期間/,/我國/固體/礦產業/各年的/技術創新/綜合水平/如何/?/
其次,通過問題表層屬性識別模型(式16)識別問題的條件和目標子句:
S=“九五”,S=“和”,S=“十五”,S=“期間”;
D=“我國”,D=“固體”,D=“礦產業”,D=“各年的”,D=“技術創新”,D=“綜合水平”,D=“如何”。
然後,利用依存語法的句法分析器(式17、式18)得到問題表層屬性識別的三元組集合表示:
S 1={(九五,和,聯合),(十五,和,聯合),(和,期間,偏正)}
1={(如何,如何,謂語),(綜合水平,如何,主語),(我國,固體,偏正),(固體,礦產業,偏正),(礦產業,各年的,偏正),(各年的,技術創新,偏正),(技術創新,綜合水平,偏正)}D
經過相似性分析無相似問題的存在。
第三步,問題隱含屬性的識別。
首先通過目標D 1找到識別問題類型的雙關鍵詞(式1é),在D 1的三元組關係表示中,找到問題的主語和謂語分別為:“綜合水平、如何”,得到雙關鍵詞為“綜合水平&如何”。
然後匹配問題類型知識庫中的“對應的關鍵詞集合”,得到問題類型的大類為“綜合水平評估類”(式20)。根據用戶選擇問題類型的小類,具體的問題類型為“技術創新綜合水平評估類”(式21)。
接下來通過該問題類型查找“對應的求解方法集合”,由係統給出的求解方法包括:綜合指數模型、層次分析模型、數據包絡分析模型、神經網絡模型、突變級數模型、全要素生產率模型。我們(用戶)從中選擇的求解方法為“基於全要素生產率(TFP)的技術創新水平評價模型”(式22)。
最後匹配求解方法“基於全要素生產率(TFP)的技術創新水平評價模型”的“求解條件—值—相關說明”,通過係統數據源分析和問題表層條件的匹配得出問題的求解條件的值:V 11=“九五和十五期間”,V 12=“固體礦產業”;而輸入變量V13、V14、V 15、V16、V17未知,輸出變量f11(目標屬性)未知(式23)。
第四步,子問題識別。
首先根據子問題產生規則(式24),除目標屬性未知外,還有五個輸入變量V