形成時間最早的是吳語。主要是在三國、兩晉之交、兩宋之交有大批北方移民進入吳地,歷代北方移民帶來的方言逐步演化成為現代吳語。不過現有的吳語區(qū)在近現代過程中,經歷了太平天國運動,使當地人口減少接近7000萬,當地原有的社會結構與宗族文化被重新洗刷,主要由太平天國運動接受以后區(qū)域內部的移民所形成,因而其宗族聚居程度和宗族勢力明顯弱于華南的大部分地區(qū)[12]。
閩語。最早入閩的漢人大致是在漢末、三國、晉初的百年之間從吳地遷入,到了唐宋時代閩語作為一種具有明顯特征的方言才明確起來,為人所注意。
湘語。湘語起源于古楚語,原先主要分布在湖南、湖北,但是因受歷代尤其是中唐以后北方移民帶來的北方話的沖擊,以及兩湖地區(qū)歷代的戰(zhàn)亂,目前具有古老湘語特征的主要保留在湘南地區(qū)。
贛語和客家話。贛方言和客家方言的核心地區(qū)在江西以及與之相鄰接的閩東和粵北。唐初大量北方移民進入贛北,這些移民的方言和古江西方言接觸形成最原始的贛語,中唐和晚唐陸續(xù)到來的北方移民,從贛北深入贛中和贛南,贛語進一步得到發(fā)展。北方來的客家人起初定居在贛語區(qū),于宋元之際西移至閩西和粵北,他們原來所使用的贛語與贛東南、閩西和粵北土著方言相交融,形成客方言。
粵語。宋代因北方遼金的侵襲,大量漢人南下廣東避難,這些人被成為客戶,據《北宋元豐九域志》記載,當時來自北方的客戶占廣東總人口的39%,宋代的移民帶來了北方方言并最后奠定現代粵語的基礎[13]。
上面是狹義的漢語方言,可以不包括官話,從方言發(fā)生學的角度來看,這些古方言基本上是在兩宋以前形成,也就是說通過明清以前的移民所形成,現有的人口格局繁衍的歷史比較長,村莊的歷史一般較長。兩宋以前的移民一般是大家族、貴族的舉族整體移民,原有的宗族結構與文化傳統在遷入地得到保持,這十分有利于宗族發(fā)育;同時他們代表了最為傳統的中原漢文化,在這些地區(qū)方言中保存了大量的古漢語,村莊的文化信仰也相對于中國北方保留了大量的傳統宗族文化;另外這些講漢方言的村莊大多形成時間早,村莊結構得到發(fā)育,保留了較深的宗族文化,目前宗族傳統和宗族勢力仍然較強,從宗族文化和宗族規(guī)范所具有的要求來講,可能會導致南方方言區(qū)較強的男孩偏好和生育數量偏好。
下面我們再看看官話區(qū)。從圖9可以發(fā)現,官話區(qū)的形成歷史最短,主要由宋以后的移民所形成。整個中國官話地區(qū),都是傳統漢民族宗族文化比較弱、村莊社會發(fā)育比較晚。這也和中國的歷史是高度相關的,因為在元明清以前,中國的移民都是從北方移向南方的,北方草原民族不斷南下,而原來的中原漢人都被擠到了中國東南方,所以東南方保留了中國的很多秦漢唐宋文化。
以西南官話為例,西南官話是在宋朝形成的,但它的擴散主要是在明清時期伴隨著西南的移民形成。目前講西南官話的地區(qū),大多是在明朝洪武年間、清朝時期遷移過去的。主要因為三個原因:一是蒙古攻打南宋是從四川打過去,在那里打了很多拉鋸戰(zhàn),所以南宋到元朝初年中人口減了7000萬,四川占了很多,所以明朝建立之后從南京、江西、安徽大量調軍向西南屯軍;二是明末張張獻忠屠蜀、清軍也在四川屠蜀,西南王吳三桂叛亂,幾次戰(zhàn)爭持續(xù)了60年;三是明清時期國外的玉米、紅薯等適合山區(qū)耕作產量高的作物傳入中國,使中國人口暴漲,人口開始向山區(qū)遷移,同時大量的“湖廣填四川”,“湖廣填四川”主要以湖北為主。所以,西南地區(qū)村莊形成較晚,同時這些移民方式多為軍屯和單家獨戶,壓力型移民,而不像歷史上宋朝以前的三大移民等戰(zhàn)亂移民,一般是大家族、貴族的整體移民。這樣西南官話區(qū)的移民很難保留原來的宗族結構和文化,同時所形成的多姓村也很難形成宗族結構村莊。西南官話的擴散推廣和明清之際湖廣地區(qū)向西南的移民是一致的,這就是西南官話區(qū)與宗族文化傳統薄弱、男孩偏好程度低、出生性別比正常的西南地區(qū)高度重合的原因。另外,東北官話區(qū)、冀魯官話區(qū)、膠遼官話區(qū)歷史都比較短,都屬于“平滑-均衡型生育轉變”地區(qū)。
上文我們從方言發(fā)生學的角度,推測了各區(qū)域宗族發(fā)育時間的差異,并以宗族發(fā)育程度為中介變量解釋漢語方言與生育轉變模式空間分布之間的相似性。那么宗族發(fā)育程度的空間分布假設能否經得起檢驗?下面從不同區(qū)域姓氏分布集中程度的角度對宗族發(fā)育程度的空間分布進行檢驗,大致思路和假設如下:
從人口遷移史和不同區(qū)域宗族聚居的情況來看,各區(qū)域現有人口遷入和人口聚居的格局形成時間的早晚與宗族聚居程度高低和宗族勢力強弱密切相關,這是因為人口繁衍和宗族形成需要時間,人口遷移年代早則意味著一個宗族定居在一地的持續(xù)時間長,便有可能通過人口繁衍形成較大的同族群體;反之,歷史較短則無法形成龐大的同族群體,并發(fā)育出成熟的宗族。因而在一個地區(qū)內,現有人口的始遷祖遷入該地的時間越早,則該地區(qū)宗族聚居之勢越強,反之,現有人口的始遷祖遷入該地時間越晚近,則宗族聚居之勢越弱。
具體而言,南方方言區(qū)[14]一般是宋朝以前的移民所形成,而且一般是大家族、貴族的整體移民,原有的宗族結構與文化傳統在遷入地得到保持,這十分有利于宗族的發(fā)育;原有的宗族文化與規(guī)范得到保持;另外這些講漢方言的村莊大多形成時間早,有足夠長的時間形成人口規(guī)模龐大的同族群體;而宋朝以后的移民所形成的區(qū)域主要是官話區(qū),其歷史比較短,包括東北官話、中原官話和西南官話區(qū),華北主要是明初“洪武大移民”時來自山西珙桐的移民,四川形成于清前期,東北形成于晚清以后,而且宋以后的移民一般不再是如南方那樣的整族遷移,而是個體性極強的移民,總之,與南方相比,北方人口不僅現有人口始遷祖遷入時間相對較晚,而且在人口最初遷移時,遷出地本身就不具備聚族而居的習俗,遷入方式以小家庭和個體為主,從而從人口遷入之始,就很少形成宗族聚居的格局,宗族文化明顯弱于南方(王詢,2007)。
要通過定量分析方法測量全國不同區(qū)域宗族的發(fā)育程度不是一件容易的事情。一個最直接的方法就是測量一個特定的空間范圍內,同一個宗族的人口在總人口中所占比重。用這種方法測量宗族發(fā)育程度,空間范圍越小,準確性就越高,空間范圍越大,則失真的可能性就會越大,同姓群體不一定是共同的祖先所繁衍。
比如說測量一個行政村的范圍內,幾個主要姓氏的人口在總人口中所占比重基本上能非常準確地衡量該行政村內宗族的發(fā)育程度,因為行政村范圍內同姓人群基本上是同一個祖先的后代[15],始遷祖在該村落基越早,則他的子孫就越多,同姓群體在該自然村的范圍內所占比重越高。這樣,現有人口遷入和人口聚居的格局形成時間的早晚與宗族聚居程度高低和宗族勢力強弱密切相關,這是因為人口繁衍和宗族形成需要時間,人口遷移年代早則意味著一個宗族定居在一地的持續(xù)時間長,便有可能通過人口繁衍形成較大的同族群體,同一個姓氏的人口在自然村內所占比例就高,戶數多;反之,歷史較短則無法形成成熟的宗族。
CGSS2006年的數據庫中有測量宗族聚居程度的變量,即全村最大的三個姓氏在總人口中所占比例及其戶數、人口數。從宗族群體規(guī)模的大小看,CGSS2006年的數據表明:在微觀的行政村層面,華南的廣東、江西、福建、廣西的村內宗族群體規(guī)模明顯大于華北地區(qū);而華北地區(qū)則遠遠大于東北、四川、以及西南地區(qū)。表3基本上能從村落的微觀層面證明:華南的宗族聚居程度和宗族勢力強于華北、華北強于東北、長江流域。但微觀層面的抽樣調查數據往往存在因為抽樣而導致的偏差,依然難以從整體上反映中國農村宗族發(fā)育程度的區(qū)域差異。由于全國性的、行政村層面的、用于測量宗族發(fā)育程度的數據庫目前還沒有辦法獲得。我們?yōu)榱藦娜珖鴮用婵坍嬜谧灏l(fā)育程度,只能將分析單位擴大。
當空間范圍擴大的時候,用同姓群體在總人口中所占比重來測量宗族發(fā)育程度可能就會失真,比如說當空間范圍擴大到縣域的時候,同一個姓氏的人口可能是來自完全不同的祖先,在歷史和現實生活中這是完全有可能的;另外在歷史上存在小姓為尋求庇護而改為大姓的情況。而在全國層面測量宗族發(fā)育程度對于本研究意義重大,為此我們根據2005年1%人口普查原始抽樣數據中有關姓氏的信息[16],從地級市的層面統計了各區(qū)域的姓氏集中程度。在具體的操作方面需要在此做幾點說明。(1)由于我們所分析的2005年1%抽樣數據庫沒有縣以下的地址碼信息,只能從地級市層面測量同姓群體占總人口比重來測量宗族發(fā)育程度。前面談到,當空間范圍越大時,用同姓群體測量宗族發(fā)育程度可能會失真,因而與縣、鄉(xiāng)為分析單位測量宗族發(fā)育程度相比,本研究的測量仍然有較大改進的空間。