“令所有數據點的集合為X,我們一般稱之為點雲(Point Cloud)。因為我們研究的數據所在的空間不是簡單的低維歐式空間,而是高維的度量空間,所以我們需要一個‘相異度#pageNote#9函數’(Dissimilarity F

un)δ:X×X→R≥0,也就是這個空間上的度量,來測量數據點之間的距離。比較常用的相異度函數有馬氏距離、e距離、min-plement距離,等等。所用的相異度函數通常會在直觀上大幅影響最終圖像的樣貌,有些相異度函數則能夠更好地在圖像上突出數據的特征。因此,在實際研究中,科研工作者們一般都會嚐試許多種不同的相異度函數,並選出最好的那個。

“第一步就是通過某種‘過濾函數’(Filter Fun)#pageNote#10,f:X→Rk,來將X投射到k維歐式空間中。在實際應用中我們一般都選k=2,也就是說投射到一個平麵……”

“等等,為什麼要讓k=2?”君遲打岔道。

“因為我們最終的呈現媒介——無論是紙張還是電腦屏幕——都是二維的。等到哪天三維全息投影真的被學術界普遍使用,我們就可以讓k=3了。”

“噢……”君遲感到臉上有些發燒,不由得摸了摸上唇的胡茬。以他對拓撲學和TDA的了解,本來絕不至於問出這種愚蠢的問題。“都是這兩年與疾病的纏鬥讓大腦生鏽了。這該死的幹眼症!”想到這兒,君遲不禁又煩躁起來,額頭上沁出一層汗珠。陳醫生似乎看穿了他的窘態與煩惱,急忙擺了擺手,示意這個小問題根本無傷大雅。

他飛快地接著說了下去,好讓君遲無暇沉浸在剛才的問答裏。

“至於過濾函數嘛,其實PCA通常就是個很好的選擇,這也是我之前費了些唇舌跟你複習PCA的原因。正如先前提到的,第一主成分和第二主成分這兩個坐標軸構成的平麵正交坐標係是所有平麵正交坐標係中包含數據方差最大的,也就是說,這樣的二維投射能夠讓信息的損失降到最低。當然了,方差隻是信息在某種程度上的衡量標準而已,根據實際情況,可供選擇的過濾函數五花八門。在已發表的論文中,不用PCA作為過濾函數的比比皆是。在更加抽象的分析中,過濾函數的值域甚至不一定是歐式空間,而是任何度量空間。

“在投射完成後,接下來要做的就是用某種重疊覆蓋,即

來覆蓋住過濾函數的圖像f(X)。這在KeplerMapper裏有默認設置,大體上是用互相有一定重疊度的正方形來覆蓋住投射在二維平麵上的圖像。舉個簡單的例子,令ε>0並假設

定義

Bε(m,n)=(m-ε,m+1+ε)×(n-ε,n+1+ε),

那麼Bε={Bε(m,n)}0≤m,n≤N-1就是f(X)的一個覆蓋。重疊度的大小(在上述例子中取決於ε)並不是特別重要,隻要差得不是太遠,最終圖像的形狀都會大致相似。

“第三步是聚類,這是機

器學習裏很基礎,也很重要的一塊內容。在TDA中,重疊覆蓋的目的就是聚類。更嚴謹地說,就是對每一個覆蓋Uj,根據所選定的相異度函數δ,用某種聚類算法來對Uj的函數原像f-1(Uj)進行聚類。注意,這裏聚類對象的所處空間是數據的原空間X,這也是需要用到相異度函數的原因。用Kj來表示f-1(Uj)所聚的類的數目,即每一個原像f-1(Uj)都分成了Kj類。將這些類用V表示(注以j和k下標),即表示為Vj,k(k=1,…,Kj)。

“根據定義,對於任意j和k≠k'''',Vj,k∩Vj,k''''=∅;但對於j≠j'''',Vj,k和Vj'''',k''''則可能相交。因此,對於任意j,我們都有

“聚類算法同樣有很多種,選定的類的數目也同樣需要視情況而定,卡爾鬆本人和幾位合作者在2007年有一篇專門討論此種聚類的論文#pageNote#11。關於這一點,我想我們沒有必要進行太過深入的探討。如果你想要一個算法作為例子,那麼單鏈接聚類法(Single-Linkage Clustering)#pageNote#12就是一個應用廣泛的算法。

“最後一步則簡單得很。用G來代表普通數學意義上的圖,將上述每一個Vj,k畫成G的一個頂點。對於任意j,k,j'''',k'''',如有Vj,k∩Vj'''',k''''≠

∅,則用直線連接這兩個頂點,使之成為G的一條邊。這樣一來,我們所得到的G就是TDA降維結果的呈現。

“所以說,TDA相較於PCA,並不是將數據投射到二維平麵而已。它接下來的幾個步驟又將投射後的數據‘遣返’回原空間中處理,因而能夠更好地還原數據在原空間裏的特征。舉幾個淺顯易懂的例子,如果將一隻手的三維影像作TDA處理,得到的將會是一幅類似於骷髏手的圖像:一條直線分岔出五條線,每條線上各有幾個節點(即V)——這就是手的最簡潔也是最具代表性的二維縮影。如果將許多糖尿病病人的數據——身高、體重、體脂、血糖、血脂、尿酸,以及各種並發症的數值作為變量,用恰當的相異度函數作TDA處理,那麼得到的將會是一個類似於‘Y’字形的圖像。‘Y’的下半部分代表著糖尿病患者都有他們的共通之處,而‘Y’上方的分叉則意味著一型糖尿病與二型糖尿病患者之間的顯著差異。在經濟學中,首次運用TDA的應該是耶魯大學的伊神滿(Mitsuru Igami)教授,他用幾百個公司在幾十年間每年幾百項專利的發表數目來研究公司創新方向的變化。不知道這篇論文你有沒有讀到過?”

“是的,我讀到過。”君遲答道。他感到腦子裏被蜘蛛網纏繞覆蓋的生鏽齒輪

開始一個帶著一個慢慢地轉動起來,每一個神經元都像初見陽光的萬年冰川凍土細菌一樣,迸發出驚人的活力。他現在能夠記起許多本以為早已遺忘的學術知識了,而他所記得的和陳醫生剛才所說的絲毫不差。他站起身跳了幾下,扭了扭脖子,抖了抖手臂,仿佛要把這兩年來附著在他身體每一個角落的黴斑都甩落似的。

然後他又慢慢地坐下,靠回沙發背,雙臂交於胸前,一對鷹眼般的眸子炯炯地盯著陳醫生:“陳醫生,我想你把基礎理論都敘述得差不多了,下麵你應該要開始講你真正的療法了吧。”

(六)

寂靜。沉默。陳醫生緊抿著雙唇,收起下巴,努力使自己的眼睛不躲開君遲那對鋒利的眉毛下射出的目光。他很想吐出幾個字,回答君遲的話,可肺裏卻仿佛被抽成了真空,一絲氣息也擠不出來。他艱難地深深吸著氣,盡量讓動作看起來比較自然,比較不著痕跡。他背部的肌肉隱隱抽動著,全身都在微微冒汗。這是他今天的最後一關,也是最困難、最重要的一關。第一關是見到一個相對“正常”的君遲,這一關在大門打開的那一刹那就已經過了;第二關是解釋療法的理論基礎並博取君遲的信任,這一關在剛才費了些口舌之後也有驚無險地過了;此時此刻,他隻需要解釋療法的具體內容——這便是最後一關。盡管事先已

經在腦海中排練過許多次,但在這一時刻真正來臨之際,之前的演習就如同吐出的煙圈一樣,轉眼間消散於無形,隻剩下淡淡的一縷煙味證明它曾經存在過。陳醫生試著讓自己平靜下來。他不知道該說什麼,隻能接住君遲適才的話頭繼續說下去,就像一列失去動力的火車靠著慣性繼續前進。

“是的。”這兩個字仿佛出自一個肺結核晚期患者之口。陳醫生趕緊幹咳了幾聲,用力清了清嗓子,這才又重新說道:“我是該正式講我的療法了。”

這句話一說完,陳醫生頓時感覺肺裏的氣壓恢複了正常,沒有了之前的那種窒息感。他趕緊接著說下去,以防自己的喉嚨再次哽住:“我們完全可以把大腦當作一個龐大的數據庫,事實上,它的確如此。每一個神經元,每一處神經突觸和樹突的接觸,每一次神經信號的傳導,就像基因決定蛋白質的合成一樣決定著人的思考與行為模式。每個人的基因都不相同,每個人的大腦更是如此。除了先天由基因決定的區別之外,每個人周圍的環境、所受的教育、與他人的交際,甚至一次精神刺激都會改變大腦的‘型樣’(Pattern)——這是我能想到的最貼切的詞彙。當然,它並不是我發明的,而是出自阿西莫夫的作品《機器人與帝國》。型樣既包括了神經元的數量和排列組合方式,又包括

了它們之間的連接方式與信號傳導,還包括了各種激素的分泌狀況,等等。對於如此複雜龐大的係統,普通的數學工具是無法描繪的,這就是為什麼要用拓撲學作為理論基礎。

“舉一個簡單的例子,創傷後應激障礙(簡稱PTSD)就是大腦型樣被外界強烈刺激大幅改變的一種精神疾病,是一種十分極端的情況。就如剛才所說,在日常生活中,適應與學習本身就是一種大腦型樣緩慢改變的過程。比方說,專攻某一門學科或專業,抑或專門從事某一項工作,都會使得某些神經元之間的突觸連接增加(即加強那些神經元之間的信號傳導),而同時不可避免地被動削弱其他神經元之間的突觸聯係,在某些情況下甚至會產生器質性的改變。早在2000年,倫敦大學學院的神經科學教授埃莉諾·馬奎爾(Eleanuire)就發表論文稱,出租車司機擁有能夠用核磁共振儀檢測出的較大於常人的海馬體後部,因為他們必須牢記複雜的城市地圖。#pageNote#13遺忘其實也是一種大腦型樣的改變方式。我們有意去記憶或淡忘某件事,甚至無意間靈光一閃記起或突然大腦空白忘記某件事,都代表著某些神經元之間在建立或減少突觸連接,這些都會對大腦型樣造成些許改變。一次怦然心動,一次怒火中燒,一次悲痛欲絕,同樣會對型樣

產生影響,隻不過微乎其微。從這個意義上來說,大腦型樣的敏感度比基因本身的敏感度要高上好幾個數量級。雖然DNA在複製過程中也會因受到外界刺激而變異,但這與大腦型樣每分每秒不間斷的變化是不能相提並論的。

“回到我之前解釋過的潛意識舒適區。雖然個體主觀上或許意識不到該區的存在,但既然能被定義為‘舒適區’,就意味著它可以穩定地影響個體的精神和行為狀態。因此,它必然存在於且必然較深地存在於大腦型樣之中。換句話說,這樣的舒適區必然是型樣的主要且重要特征之一,不會被日常生活中微小的刺激改變。想必你一定聽許多醫生說過,你的幹眼症有一大部分與心理因素有關。我相信你這兩年一定也費了很大功夫調整心態,甚至用了一些治療精神疾病的藥物,但效果都不太明顯。”

“沒錯。”君遲嘴上答著,心裏想的卻是“說到正題了”,他不由得一陣激動,陳醫生先前解釋過的幾種理論基礎,此刻在他心裏已經如幾塊拚圖一般大致就位。對於這個療法,他已經猜得八九不離十了,就等著陳醫生親口說出來。

“正如我之前所說,”陳醫生繼續滔滔不絕道,“在一個人心理出現問題,而對於這種異常又給不出合理解釋時,我們就可以反推出這個人存在著某種病態的潛意識舒適區。我提到過

,這是概率事件,但按照我的判斷,你大腦裏就存在著這樣的病態潛意識舒適區。”陳醫生說到這兒,停頓了一下,想看看君遲有什麼反應。君遲隻是點點頭,似乎是在表示讚同,又似乎是在鼓勵陳醫生接著說下去。

“我剛才又說,潛意識舒適區一定較深地烙印在大腦型樣中,尤其是造成你這種病症的舒適區。這一點確鑿無疑。既然大腦型樣本身就是一個龐大的數據庫,而這個舒適區又是這個數據庫的重要特征之一,那麼運用與TDA類似的方法,我們就可以將這個明顯特征在三維坐標係裏呈現出來。如果你還記得TDA的四個步驟,那麼這個方法其實在概念上大同小異。先將神經元的分布及其間突觸連接的方式通過某種極為複雜的過濾函數φ從大腦空間投射到三維歐氏空間,即φ:X→R3,再將φ的圖像用體積相等的正立方體重疊覆蓋,然後將每個立方體中的神經元進行聚類,最後按照神經元的‘類’中的總數目及其間的總信號傳導方向和強度進行繪圖。總結起來就是,我們要將你腦中抽象的,連你自己都意識不到的病態潛意識舒適區,投射到現實的三維世界中來,這就是所謂的‘拓撲投射法’。”最後這句話,陳醫生說得斬釘截鐵。

雖然之前已差不多猜到,但這番話君遲此刻聽在耳裏,還是忍不住全身血脈僨張

、激動不已。他甚至能聽到自己心髒猛烈的跳動聲。這個方法乍聽起來異想天開,但細細琢磨一番後又感到極其合理。隻是他認為這樣的過濾函數φ一定十分複雜,也不知道具體操作起來是怎樣的,畢竟任何事情從理論到實踐都有很長一段距離,所以心中還是不免有些惴惴不安。

又沉思了一會兒後,君遲才終於開口道:“所以讓我試著來概括一下你的療法。我的幹眼症無法康複的很大一部分原因,在於我腦中有一個病態潛意識舒適區,這個舒適區是你所謂的大腦型樣數據中的一個顯著特征。那麼用類似TDA的基於拓撲學的方法,你可以找到這個舒適區,並將其投射到現實世界,然後……”

“然後隻要你能在現實世界裏邁出這個舒適區,就相當於你在潛意識中走出了這個病態舒適區,你的病自然就好了。”陳醫生毫不猶豫地接著說。

“可是,如果真是這樣,那這個方法豈不是可以治療任何與心理因素有關的疾病,甚至可以治療任何精神類疾病?”

“好問題。”陳醫生幽幽地歎了口氣,目光頓時黯淡了下來,“這確實是最終目標,在理論上也的確可行,可實際操作起來卻有極大困難和危險。假設某人患有某種與心理因素有關的疾病,但心理因素與這種疾病之間卻隻存在著弱相關性,那麼他的潛意識舒適區在大腦型樣中的

印記就不夠明顯,並不一定能投射出來(這點與TDA是類似的),甚至還可能造成輕微的精神錯亂,讓治療得不償失。可如果某人患有與心理因素強相關的疾病,或者幹脆患有精神病,那麼投射的風險就太大了。相信你還記得我剛剛提到的‘三圈理論’:走出舒適區的意思就是跨入學習區\/最佳表現區,這個區域位於舒適區與危險區之間,可以視為某種具有保護作用的緩衝地帶。疾病與心理因素的相關性越強,投射出來的學習區就越小,緩衝地帶就越少。也就是說,對這類病人使用拓撲投射法會讓他們在現實中很容易無意間步入危險區,進而造成不可逆的大腦損傷。因此,隻有像你這種所患疾病與心理因素之間的相關性剛剛好的特例,拓撲投射法才能發揮作用。在我剛開始講述潛意識舒適區的概念時,你曾問過我這個方法是不是有較大風險,我的回答是肯定的。這便是理由了。至於我之前反複強調的醫生的直覺,我想在此重複一遍。”

“我相信你,陳醫生。”君遲的目光鋒銳而堅定,也充滿了信心,“那麼現在告訴我具體應該怎麼做吧。我無法想象在實際操作中怎麼用拓撲之類的數學方法過濾並投射大腦的數據,這個φ函數聽上去就複雜得很。我猜要在我頭上開一刀,或者需要用到個什麼類似核磁共振的儀器?”

不必,吃片藥就行了。”陳醫生一邊語氣輕快地說著,一邊從衣服口袋中掏出一個白色小瓶,倒了一片在手掌心。“這藥裏有許多納米機器人,可以進入你的大腦中,感知測量你的大腦型樣,並計算出合適的過濾函數。你說的沒錯,計算這個φ函數的複雜程度遠在人力所及之外,它根本就沒有解析解,所以隻能靠這些納米機器人。它們會自動完成過濾、覆蓋、聚類、繪圖這四個完整步驟,然後直接將形成的舒適區投影傳到我的電腦裏。下周我會再來,到時候我就會告訴你投射的結果是什麼。”

“這些納米機器人也是你開發出來的?”君遲不由得吃了一驚。

“不是,我哪有這個本事。這是我的一位同事做的,具體的理論和研發細節我也不太清楚。不過對此你可以絕對放心,他是這個領域裏當仁不讓的佼佼者。”

“這些納米機器人也可以穿過血腦屏障#pageNote#14嗎?”

“那當然了。要是連這點都做不到,還怎麼描繪你的大腦型樣?”

君遲稍微遲疑了一下,隨後便接過了藥片。他和陳醫生隻不過談了兩個小時左右,態度卻從懷疑、不屑與厭惡轉變為強烈的信任。陳醫生作為一名醫生,連數學方麵的知識都掌握得比他多,那他自然無須懷疑陳醫生在醫學上的造詣了。他也沒去拿水杯,直接把藥片送進嘴裏,“咕咚”一下咽了下去。

“這藥

怎麼一股薄荷味兒啊?”君遲咂巴著嘴,有些奇怪地問道。

“怎麼,難道你還想吃巧克力味兒的不成?”陳醫生笑了笑,站起身來,一副大功告成的模樣。他舒展了一下身體,揉了揉有些酸痛的腰背,準備和君遲握手道別。

“對了,陳醫生,”君遲也站了起來準備相送,卻好像突然想到了什麼似的,“我現在吃了藥,相當於我已經預先知道了我的生活中會出現某種投射……”

“這你完全不用擔心,”陳醫生沒等君遲說完便打斷道,“你的生活不會發生任何變化,不會有頭暈頭痛之類的副作用,更不會出現什麼幻象。而且我之前提到過,你的情況很安全,不必擔心自己會一不小心就走進危險區。這一個星期你該幹嗎幹嗎,隻需按照平時的習慣生活就好。”

“哦,這點我倒不太在意。”君遲發現陳醫生誤會了自己的意思,有些尷尬地擺了擺手。“我剛才是想說,既然我已經知道了會出現某種投射,那麼這種事先的‘預知’會不會影響投射結果?就好比如果一個病人知道自己吃的是安慰劑,那就不會再有什麼安慰劑效應了。”

“沒有的事。這和安慰劑效應的原理完全不同。”

陳醫生停頓了一下,似乎在思考怎麼向他解釋這其中的不同。不過他的停頓隻持續了不到半秒鍾。君遲想,這大概是因為他之前的幾個問題陳醫生都回答

得太過迅速流暢,感覺像是事前練習背誦過一樣,這才讓此刻的遲疑顯得尤為突兀。

君遲沒有接話,等待著陳醫生接著說下去。一陣風從窗外吹過,藍黑色的窗簾被輕柔地順勢帶起,仿佛一滴濃鬱的甘藍汁滴入水中,慢慢暈開。夕陽趁著空隙偷偷鑽進廳裏,陳醫生頰側的汗珠被照映得格外晶亮。

“安慰劑效應,這個……如果你還記得的話,一般是指在單盲或雙盲實驗中,控製組的研究對象因心理作用而產生的對‘無效治療’的正向反應。而就你的情況而言……為了使你能夠走出投射出來的舒適區,我必須把具體的投射結果告知你。因此,並不存在所謂的‘安慰劑’,整個治療過程中也根本沒有‘控製組’這個概念。”

“對了,”過了幾秒,陳醫生又補充道,“事實上,即使這種‘預知’真的產生了什麼出乎意料的影響,結果也一定會像典型的安慰劑效應一樣是積極的。”

“這樣啊……”君遲若有所悟地點點頭,用力眨了幾下疲累的雙眼。“不早了,”他說,“今天的談話該結束了。”於是他和陳醫生握了握手,禮貌地把對方送出門去。

回到客廳的沙發上坐下,君遲又在腦海中反複重演了幾遍他們剛才對話的場景:陳醫生有時滔滔不絕,有時略微發窘,有時又麵露憂色。他也不知道陳醫生心裏在打什麼算盤,卻總隱隱感

覺陳醫生有什麼不可告人的秘密。他問依塵有沒有覺得陳醫生哪些地方不對勁,依塵隻橫了他一眼,“別人來給你治病,好不容易把你枯萎的腦袋瓜激活了,你反倒猜疑起來。陳醫生的直覺用來治病救人,你的直覺卻專咬呂洞賓。”隨即伸手在他的額頭上輕輕彈了一下。