基於內容分析法的城市曆史街區意象研究
作者:高峻 韓冬
摘要:本文從個性、結構和意蘊這個3個意象理論的基礎性構成元素出發,以國內外遊客的網絡遊記、評論等文本為研究材料,采用內容分析法對國內外遊客遊覽過曆史街區後產生的意象進行對比分析。研究發現,國內外遊客感知到的意象在個性和結構方麵存在較大差異。在個性方麵,將提取出的特征詞歸納為4個主題特征並計算出了4個主題的強度:國內遊客對於豐富的曆史文化遺存(338.43)和優美的城市景觀(377.91)的感知分別高於國外遊客(140.32,179.05);而國外遊客對於獨特的人文風情(400.96)與現代的都市生活(300.96)的感知分別高於國內遊客(188.84,254.54)。在結構方麵,從國內外樣本中提取出的高頻地名分別為29個和4個,國內遊客對於區域的空間感知度明顯高於國外遊客。意蘊方麵,國內外遊客差別不大,國內外遊客的正麵情感數量分別占到各自總數的59%和55%,大多數遊客從中獲得了較好的旅遊體驗;但國外樣本中的負麵情感(16%)高於國內樣本中的負麵情感(9%)。因此,需要針對國內外遊客的不同特點,有針對性地對上海曆史街區的旅遊進行開發。
關鍵詞:內容分析;曆史街區;意象;網絡文本
0 引言
凱文·林奇(1960)The image of city(《城市意象》)一書,開啟了意象理論研究的先河。他在書中提出,城市意象,實質上是指觀察者對城市環境意象的感知,是觀察者與所處環境雙向作用的結果,由個性、結構和意蘊三部分組成;並提出了研究城市意象的5個元素,即道路、邊界、區域、節點、標誌物。林奇的城市意象研究,早期主要采用繪製地圖草圖以及麵對麵訪談法,後期又加入了係統問卷調查法、認知距離等方法。
林奇之後,城市意象的研究不斷增多,意象理論也不斷深化,但多采用和林奇相似的研究方法,即采用認知地圖法、訪談法和問卷調查的方法來對不同區域的意象進行研究(馮維波,黃光宇,2006;顧朝林,宋國臣,2001;Lee,Schmidt,1986;Lee,Schmidt,1988)。盡管林奇的調查研究方法具有較強的科學性,但因其中研究跨度大、研究時間長、研究主觀性較強等特點,較易受到調查者個人背景和繪圖能力差異的影響,通過這種途徑研究城市意象很可能出現一定的偏差,這使得後期的學者努力探尋更多的意象研究方法。一些學者以圖像、文字等媒介為挖掘材料,開展了對各類城市空間意象的研究(趙渺希,劉歡,2012;戴光全,陳欣,2010;Filipcevic,2007;Crang,2003)。隨著科學技術的發展,信息傳播、交換、收集與整理作為一項特殊的行業獨立出來並迅速發展,傳統媒體依舊發揮著作用,而網絡等新興媒體也迅速發展壯大。在web2.0時代,人們更願意在網絡當中表達自身的真實感受,對這些網絡中的信息進行收集用以分析其意象就更為真實。但目前從新興媒體中獲取信息用以意象研究的為數不多。
研究曆史街區的意象可通過多種方式進行,其中利用網絡遊記、評論等網絡文本是一種全新的方式。遊記及評論是一種個人旅遊經驗的呈現,能夠用以表達遊客內心的體驗與感受,通過對遊記及評論的解讀,可以探究其對曆史街區的意象。計算機技術的發展和數據挖掘技術的應用,使得通過分析遊記及評論獲得曆史街區意象在技術上已經成為可能。內容分析法就是對網絡內容進行分析的主要方法之一(周黎明,邱均平,2005)。隨著互聯網的普及,網絡成為了新興的信息傳播平台,越來越多的學者開始運用內容分析法對網絡信息進行分析。與基於傳統媒體的內容分析法相比,基於網絡的內容分析法發生了許多顯著的變化,研究對象不再局限於一般的文字信息內容,而開始麵向整個網絡的信息內容(邱均平,2010)。
本文從意象理論構成的基礎元素出發,選取上海市具有代表性的曆史街區衡山路-複興路曆史街區為研究對象,采用內容分析法分析國內外遊客遊覽衡山路-複興路曆史街區後在互聯網上發表的遊記及評論,從個性、結構和意蘊3個方麵將中外遊客對該區域的意象進行對比研究。
1 研究設計
1.1 研究區域概況
衡山路-複興路曆史街區由上海市劃定的衡山路-複興路曆史文化風貌區以及與其相鄰且關聯度很高的徐家彙和田子坊構成。衡山路-複興路曆史文化風貌區,東界重慶中路-重慶南路-太倉路-黃陂南路-合肥路-重慶南路,南界建國中路-建國西路-嘉善路-肇嘉浜路,西界天平路-廣元路-華山路-江蘇路,北界昭化東路-鎮寧路-延安西路-延安中路-陝西南路-長樂路,其範圍大致相當於昔日上海法租界1914年的擴展部分(所謂法新租界)。該風貌區是全市曆史風貌保存最完整的、以花園住宅為主要特征的風貌區,占地麵積7.75平方千米,涉及徐彙、(原)盧灣、靜安、長寧4個行政區
1.2 樣本選取
以“螞蜂窩”作為中文樣本抽取網站,抽取與研究區域相關度最高的500篇遊記、評論文本作為樣本。在這些樣本中,剔除全部為照片或視頻的遊記、全部為科普介紹的遊記以及體裁為詩歌的遊記,最後篩選出105篇作為研究對象。
選取Trip Advisor作為英文樣本收集網站,抽取相關性最高的500篇文本作為樣本,最終篩選出113篇作為研究對象需要說明的是,以“衡山路-複興路曆史街區”為關鍵詞搜索,在“螞蜂窩”中隻搜到3篇,以相應的英文history and cultural area of hengshan roadfuxing road進行檢索,搜索不到相關信息。衡山路-複興路曆史街區的範圍大致相當於昔日法租界第三次擴展的範圍,因此,本文以“法租界”和“French concession”為關鍵詞進行搜索。 。
1.3 數據處理
1.3.1 樣本處理
研究選取Rost Content Mining軟件作為分析工具,該軟件具有中文分詞、詞頻統計等功能,可以對(.txt)文件進行內容分析。
首先,對中文樣本進行處理。在自定義詞典中加入區域內地名如“新天地”等,專有名詞如“石庫門”等,以保證分詞和詞頻分析結果的準確。運用軟件分析出各文檔詞頻的初步結果,把“的”“是”“在”等介詞、連詞、助詞等常見但又與研究無關的詞彙納入軟件過濾詞彙表,把表達意思一致,但表達方式不同的詞語進行統一替換,如“孫中山舊居”“孫公館”“孫先生舊居”統一為“孫中山故居”。
其次,對英文樣本進行處理。將常用的但和研究無關的詞語如a、is、we等收入stop詞典當中,把這些詞語排除在詞頻統計之外;把複數名詞統一為單數名詞,過去式和進行式統一為一般現在式;把專有名詞進行統一替換如Huaihai rd、Huaihai lu統一為Huaihairoad。
1.3.2 基於高頻詞分析的處理
運用Rost Content Mining軟件進行詞語頻次統計,得到各種詞語的頻次。在進行不同來源的數據比較過程中,受到采集樣本的數量、內容等方麵的影響,單純采用采集頻數進行對比並不客觀。因此,本文借鑒趙渺希等(2012)提出的對不同來源的詞頻進行標準化換算,以Na表示某一數據來源中詞語a出現的頻次,並按照a對應的數據來源中詞頻的最大值Nmax進行換算,作為詞語a的詞頻得分N′a:
N′a=Na·100/Nmax