正文 對我國人口普查數據質量評估的若幹思考(1 / 3)

對我國人口普查數據質量評估的若幹思考

名家觀察

作者:陳培培 金勇進

摘要:文章根據官方公布的曆次中國人口普查方案和相關數據質量抽查實施辦法,分別從普查摸底階段、普查登記彙總編碼階段和普查事後質量抽查階段分析現有人口普查數據質量評估特點,並在此基礎上提出了雙係統估計量在我國普查實踐中的科學應用、彙總數據時要綜合運用評估方法和在普查數據質量抽查中采用係統完善的抽樣設計等改進措施,期望能夠進一步完善人口普查數據質量評估的理論方法。

關鍵詞:人口普查;數據質量評估;事後質量抽查

一、 引言

人口普查是一項重大的國情國力調查,人口普查的數據結果為科學製定國民經濟和社會發展規劃、統籌安排人民的物質和文化生活、構建社會主義和諧社會提供科學準確的統計信息支持。目前國內學者主要從數據質量控製和數據質量評估兩個方麵對人口普查的數據質量進行研究,比較有代表性的有:李成瑞(1984)從我國1982年人口普查的方案設計、普查登記和數據處理等方麵介紹了數據質量控製的具體措施;武潔(2002)介紹了我國第五次人口普查的事後質量抽查;張為民等(2003)采用人口統計分析法評估了我國第五次人口普查的某些代表性指標;胡桂華(2013)通過對比我國與美國等五個國家的人口普查數據質量評估情況,對我國人口普查質量評估提出若幹改進建議。

我國先後經曆了六次人口普查,1953年第一次人口普查後在全國抽取了9%的人進行複查,這可以被視為我國最早的事後質量抽查嚐試。改革開放後,從第三次全國人口普查開始,每次都要在普查登記工作結束後開展事後質量抽查,並從2000年第五次人口普查開始引入雙係統估計量評估普查數據質量。雖然曆次人口普查都開展了事後抽查,但相比國外,我國的人口普查數據質量評估尚處於經驗借鑒中。從我國已有的人口普查事後抽查看,人口普查事後抽查也亟待進一步從理論上加強和完善。

二、 對現有人口普查數據質量評估的認識

1. 普查摸底階段缺乏嚴謹的數據質量評估方法。《全國人口普查條例》規定人口普查對象為普查標準時點在中華人民共和國境內的自然人以及在中華人民共和國境外但未定居的中國公民,不包括在中華人民共和國境內短期停留的境外人員。為了保證人口普查登記期間普查登記工作的不重不漏,需要通過普查登記前的摸底工作編製《戶主姓名底冊》,真實、全麵地記錄本普查小區所有房屋及其他建築物內居住人口的狀況。《戶主姓名底冊》不僅是普查登記工作的主要依據,而且也是各級人口普查辦公室指導工作、核查質量和驗收數據的重要依據,同時還為抽取普查表長表調查戶提供抽樣框,因此編製高質量的《戶主姓名底冊》至關重要。

我國第一次和第二次人口普查方案中均未明確說明普查登記前是否編製《戶主姓名底冊》,1982年第三次和1990年第四次人口普查方案僅規定在普查登記前根據戶口整頓情況編製《戶主姓名底冊》,但未開展摸底工作。2000年第五次和2010年第六次人口普查方案明確規定在戶口整頓和區域劃分的基礎上由普查員、普查指導員通過實地勘察和入戶訪查,開展摸底工作,並在此基礎上編製《戶主姓名底冊》。摸底工作完成後,鄉級人口普查辦公室組織村級人口普查小組和普查指導員對各普查小區《戶主姓名底冊》的彙總結果進行評估,結合經整理的流動人口、戶籍人口、港澳台和外籍人員、死亡人口和出生人口等資料以及房管、物業部門提供的入住率(空房)清單、出租房屋戶數等資料進行比對,確保在正式普查登記之前及時發現問題,保證普查數據質量。

人口普查數據主要從普查摸底和登記填報這兩個環節取得,其中普查摸底工作關係到普查地址碼庫建立的準確性,是一項基礎性工作。因此,普查摸底數據質量不僅是普查數據質量的基礎,同時也關係到普查事後抽查樣本框的質量。雖然我國自第五次人口普查以來均製定了全國統一的摸底工作細則,明確了摸底工作的實施過程和質量控製措施,但隻是對各普查小區《戶主姓名底冊》的彙總結果進行比對評估,並沒有在摸底工作結束後隨機抽取一部分普查區重新逐戶調查核對,也沒有製定統一的主要數據質量評估指標。因此,有必要采用係統完善的抽樣設計保證普查摸底質量評估的可行性。

2. 普查登記彙總編碼階段的檢驗規則過於單一。我國人口普查主要調查人口和住戶的基本情況,內容包括姓名、性別、年齡、民族、國籍、受教育程度、行業、職業、遷移流動、社會保障、婚姻、生育、死亡和住房情況等。1953年我國第一次人口普查僅調查6個項目;1964年增加了本人成分、職業和文化程度3項;1982年增加到19項;1990年又增加了“遷來本地的原因”和“1985年7月1日常住地狀況”兩項;2000年第五次全國人口普查表分為普查表長表、普查表短表、暫住人口調查表和死亡人口調查表四類,其中長表已達到49個項目,分為按戶填報的項目和按人填報的項目,比上一次普查增加了28項,並首次加進了住房項目;2010年第六次全國人口普查表分為普查表長表、普查表短表、境外人員普查表和死亡人口調查表四類,其中長表共計45個項目。由此可見,普查表和普查項目越來越多。雖然我國曆次人口普查均開展了複查審核驗收工作,但還是很有必要建立一套係統完善的數據質量控製和評估係統。

人口普查登記彙總編碼階段的審核評估屬於數據質量評估技術中的邏輯規則檢驗範疇,主要檢驗普查表填報代碼、普查表內和表間相關指標的邏輯關係的一致性和準確性,主要通過彙總、議查或個別訪查和人工邏輯檢查方法驗收。這種審核驗收方法需要事先了解普查表內和表間進行對比的相關指標間的邏輯關係,而且這些相互對比的指標又互為參照標準,使得驗收結果隻能反映誤差的方向(被高估或低估),不能反映誤差的確切水平。所以實踐中,需要采用更多的方法評估人口普查登記彙總數據的質量。