小云哥哥,语言学男博士,专门研究汉藏语系的语言 阅读原文 这个问题有点儿大,真正要介绍可能得好几本书才能说完 。从科普的角度,我希望可以既不泛泛而谈,又不进入太多无聊的细节。我先从概貌说起吧。 汉藏语系的语言确实在类型学上非常丰富。实际上我们只要比较两个极端,就可以看出同为汉藏语系的语言,在类型学上有多么不同。 嘉绒语茶堡话的前缀系统相当复杂(可以在这篇文章中进一步了解)。比如说,我们在茶堡话中可以得到带有八个甚至更多前缀的动词[1]: a-mɤ-ɕ-tɤ-tɯ́-wɣ-z-nɯ-snɯ-ɲaʁ ra IRR-NEG-TRANSLOC-PFV-2-INV-CAUS-DENOM- 心 - 黑 需要 但愿不要让他跑去对你不安好心! 茶堡话的例子中,除了我们能用汉语翻译出的词素,如否定,关联位移(“去”),人称等等,还有一些必须存在的,但汉语不一定需要翻译的词素,比如 IRR(未然)、PFV(完整体)、INV(反向)等词素。这些都是汉语母语人学习茶堡话时的难点。 我们再看一下典型的孤立语,缅语的例子[2]。 hsaya pyoː h̠t̠a hman me 老师 说 NOM 真 RLS 老师所说的应该是真的。 缅语的例子中,基本上所有的词素都有汉语的对应。跟汉语一样,它不需要再动词上加任何时体态标记。 除了肉眼能从句子上看出的形态区别,我们也要注意到缅语是有词汇声调(lexical tone)语言,跟汉语一样,它的音节有预先设定好的、可以区别意义的声调。然而茶堡话却是一个没有声调的语言,只在偶尔的情况下有语法上的重音。 我们可以发现, 茶堡话和缅语分别在形态句法上和声调系统上走了两个极端,一个形态极其复杂, 另一个几乎没有形态;一个不具备声调,另一个声调系统完备。然而就是这两种极端不同的语言,居然在汉藏语的分支上有着较为相近的发生学关系。按照 Sagart et al (2019)[3]的结论,彝缅语和嘉绒语组同属缅 - 嘉绒语支,分化年代大约在 4500 年前(他们认为汉藏语的第一次分化在 7200 年前,也就是说汉藏语第一次分化后,过了差不多 3000 年,彝缅语才跟嘉绒语组分开)。缅 - 嘉绒语支在后续的研究中得到了较充实的语言学证据,比如 Jacques and Pellard (2020)[4]的文章中,指出了它们的共同创新。 缅 - 嘉绒语支 也就是说,即便在同一分支下,汉藏语系的不同语言也会呈现截然不同的类型学特点。因此,要以汉藏语系的分支为单位总结出类型学特点似乎是不大得当的思路。 在接下来的内容中,我重点谈几个部分。音系方面,我还是从最容易入手的角度,声调说一说吧。形态句法方面,我谈一谈语序、词缀和论元标记的问题。 声调的多样性 声调的类型学可以从很多方面讨论。我们可以从最简单的声调的数量开始讨论,或者从声调 F0 的变化讨论,比如 F0 是否有明显的变化,也可以从声调系统的类型结合语法讨论。 如果我们把目光伸向喜马拉雅山西侧的汉藏语系语言,我们会发现一个趋势,越望西走,声调数目就越少。如图[5]。 白色表示无声调,紫罗兰表示两个声调,红色表示三个以上声调 但这也并不代表所有情况,比如那加兰的 Mongsen Ao,就有三个声调[6],尼泊尔的 Manange 语有四个声调[7],而孟加拉国的 Mru 语,则达到八个声调之多。有时,我们根据不同的分析方法, 可能会数出不同的声调数目。比如说拉萨话的声调,如果仅仅按照声母的发生态产生的声调,可以简单地分为两个声调(相当于汉语的阴阳声调)。但是,如果考虑到不同音节类型对声调的影响, 我们又可以细分出多个声调[8]。 拉萨话声调的不同分析 拉萨话的声调是蛮让人烦恼的,可是如果纵观所有藏语方言,我们会发现各种各样不同的声调类型。孙天心(1997)[9]总结了各种藏语方言的声调类型,并发现这其中存在一个过渡带: 我们看到,藏语方言从无声调到有声调过渡,分别有几个阶段: 没有音系上的声调,也没有丰富的“习惯”调 没有音系上的声调,有丰富的“习惯”调 在特定的环境中有音系上的声调 基本存在音系上的声调,但声调在某些音节类型中不稳定或者不具备区分性 音系上的声调稳定 在存在稳定的音系声调的基础上,还会有降调和平调的区别 不禁让人感叹,区区一系列的藏语方言,居然让我们在共时上看到了声调的逐渐产生。就像在一座山上看到四季一般。只是这六种类型不一定有地缘的联系。 声调系统的类型在汉藏语系中也几乎应有尽有。从所谓的 pitch accent/word tone 语言,到 lexical tone 语言,都可以在其中找到。而且这些语言的分析方法都不尽相同,跟语言所处的地理位置也没有必然的联系。我们的茶堡话是无声调的语言,但同在马尔康市的卓克基话却呈现着严格的声调系统,我在这个回答中介绍了。究竟是茶堡话丢掉了声调,还是卓克基话发展出了声调,我们现在暂时还不知道。在大部分语言都是词汇声调语言的汉语族,也能包着一些可以有其它分析方式的声调语言,比如上海话声调系统这一热门话题,曾经被无数次研究过,pitch-accent 的分析方式也是其中一个挥之不去的思路。考虑到吴语使用者有很多,希望大家可以留言提供一下自己的想法。 究竟我们能不能总结出汉藏语系的声调类型学呢?Evans 针对喜马拉雅地区的语言,给了我们两个截然相反的答案[10]。 不可以。这些语言并没有 Greeberg 定义下的类型学,无法作出有效的预测。 可以。这些有发生学关系的语言的声调中存在某些共同趋势。 声调我就讲到这里。 词序的类型 这一节我主要参考的是 Dryer 对藏缅语语序类型学的研究[11]。 如果我们简单地把词序的类型归纳成 SVO、SOV、VSO 等等模式的话,我们可以得到六种可能的模式。但是世界语言中,有的模式,诸如 VOS 和 OVS 是非常少的,大部分的语言集中在 SVO 和 SOV 上。已知的汉藏语系语言逃不出这两种基本语序。除了汉语以外,大部分的汉藏语系语言都属于 SOV 类型,当然也有少数,如克伦语和白语,属于 SVO 语言。需要注意的是,属于大部分的 SOV 语序,不仅仅是 SOV,而且往往是严格的动词末位(verb-final)语言。 我们可以比较克伦语[12]和绰斯甲语的语序。 克伦语 ʃɛ ní dòkhí tə-ɗó 陷阱 捕捉 獐子 一 -CLF 陷阱抓住了一只獐子。 绰斯甲语 cə̂=ɣə bjænê ɑ-dzíd 3SG=ERG 肉 PST.INV- 吃.II 此人吃了肉。 虽然汉藏语系的语序只呈现了最常见的 SOV 和 SVO 语序,但并不代表它们在类型学上没有价值。我们可以通过大量的材料,从中发现一些类型学趋势。我们可以看看呈现 OV 语序的语言究竟有哪些类型学的趋势。 首先,我们发现 OV 语言更吸引后置语素。大部分汉藏语系语言的后置语素非常丰富。包括了格标记、句法标记、助动词等等。 另外,方式副词在 OV 汉藏语中更倾向于在动词前边。比如说: Lai Chin[13] duhsan-tei a-chim 慢 -ADV 3SG- 说话 他慢慢地说话。 Purki[14] kʰo-s šoqsmo šoqsmo sila-t̪ 3SG-ERG 快 快 读 -PRES 他读书读得很快。 这两个趋势非常显著,也大致与世界上的各语言的类型学趋势差不多。但是,麻烦的地方就在,有一些语序不能通过 SOV/SVO 的基本语序预测。这就造成了很大的多样性。这些无法预测的语序包括: 名词和形容词的顺序。情况非常混乱。比如单单在 Bodo-Garo 语言中,就有三种情况,名词在形容词前,如 Deuri 和 Bodo。名词在形容词后,如 Dimasa, Kokborok, Garo。两种顺序混用,如 Kachari。 关系句和名词的顺序。有的语言中,名词在关系句前(如藏语);有的语言中,名词在关系句后,如羌语;实际上很多嘉绒语组语言名词可以在关系句前,也可以在关系句后。 名词和指示代词的顺序。许多语言的指示代词在名词前,如列普查语、独龙语等。也有指示代词放名词后的,如 Ao, Tangkhul 等等。也有两种顺序都接受的,如 Jugli。 数词和名词的顺序。有数词在名词前的,如加德满都尼瓦尔语。但是它旁边的 Dolakhā Newār,却支持两种情况,数词可在名词前,可在名词后。 程度副词和形容词。Mising 语中,程度副词在形容词前。Angami 中,程度副词在形容词后。 否定词和动词。大部分的藏语支语言,否定词都在动词前。但是也有几个,如 Purki 和锡金话,否定词在动词后。 这些不可预测的语序现象实际上是最有意思的,可以为语法化的类型学提供相当多的研究可能性。 怪异的前缀偏好和行为 在上一节中,我们提到了 OV 语言更倾向于使用后置词素。在汉藏语中,OV 语言确实非常喜欢后置词素,但这些后置词素大部分限于后置附着词(enclitic),而非后缀。不少汉藏语系语言尽管属于 OV 语,拥有丰富的后置附着词,但它们同时却有着强大的前缀偏好。 这一现象明显违反了 Greenberg (1966)提出的类型学趋势: If a language is exclusively suffixing, it is postpositional; if it is exclusively prefixing, it is prepositional. 如果一个语言是绝对的后缀型语言,那么它就是后置词素语言;如果一个语言是绝对的前缀型语言,它就是前置词素语言。 同时,前缀型语言在世界语言中,也是少数。 Haspelmath et al (2005)统计了 894 种世界语言,得出了以下的数据: 类型数量百分比 没有或极少屈折形态12213.65% 强后缀偏好38242.73% 后缀偏好11412.75% 前缀、后缀占相似比例13014.54% 前缀偏好9210.29% 强前缀偏好546.04% 从这一组数据可以明显看出,强前缀偏好的语言不是世界语言的主流。而强前缀偏好同时又是后置词素型的语言更是少之又少。这类型学的奇葩恰好落在汉藏语身上。比如说嘉绒语组语言就是比较典型的,我们在第一节已经看到了茶堡话的前缀例子。 Lai (2021)[15]研究了绰斯甲语斯跃武话的前缀链条,并给出了有关前缀链的产生过程的假说。 绰斯甲语斯跃武话的前缀框架 通过分析前缀链条中(主要是屈折前缀)各前缀的历史层次,发现越靠近词干的屈折前缀,年龄越小。也就是说,绰斯甲语斯跃武话的屈折前缀从外到内(即从前到后)是按时间顺序排列的,与语义没有关系。新来的前缀就会直接粘在已有的前缀链后边。这就指向了这些前缀实际上本身是后置词素,只不过恰好堆积成了一个链条,成为了一个副词性质的整体,我们上一节说过,副词有放置于动词前边的整体趋势,因此这个链条一直放在动词前边,最后和动词融合在一起,成为前缀。也就是说,绰斯甲语一直在跟随类型学的大趋势走,但是一不小心之下,发展出了罕见的类型学现象。 这告诉我们一个人生的道理,即便你一生循规蹈矩,也可能“行差踏错”。 与嘉绒语组语言拥有相对固定位置的前缀不同,汉藏语系的某些语言走了另一个极端,有着非常自由的前缀位置。这就不得不提到 Chintang 语[16]。Chintang 的前缀不受句法和语义的约束,可以随心所欲地调换位置。比如以下的句子,a 和 b 的意思都是“你没睡觉”。从 e 到 f,意思都是“他们没看见我们”。前缀的位置在每句话中都不一样。 a. a-ma-im-yokt-e 2-NEG- 睡觉 -NEG-PST b. ma-a-im-yokt-e NEG-2- 睡觉 -NEG-PST c. u-kha-ma-cop-yokt-e 3NS.A-1NS.P-NEG- 看见 -NEG-PST d. u-ma-kha-cop-yokt-e 3NS.A-NEG-1NS.P- 看见 -NEG-PST e. kha-u-ma-cop-yokt-e. 1NS.P-3NS.A-NEG- 看见 -NEG-PST f. ma-u-kha-cop-yokt-e. NEG-3NS.A-1NS.P- 看见 -NEG-PST g. kha-ma-u-cop-yokt-e. 1NS.P-NEG-3NS.A- 看见 -NEG-PST h. ma-kha-u-cop-yokt-e. NEG-1NS.P-3NS.A- 看见 -NEG-PST 造成这样极端的自由前缀位置的行为,实际上也是出于偶然。在 Chintang 语中,一个语法词可以容纳多个音系学词。而音系学词正是前缀附着的单位,而非语法词。因此,前缀要满足的条件只有一个:安全地降落在某个音系学词上,而不必理会其它的因素。这样就造就了自由的前缀位置。 论元标记 当我们说汉藏语系可能是类型学上最丰富的语系时,我们时常会想到汉藏语系中孤立语和多式综合语并存的事实。这两种类型的一大区别在于论元标记。我觉得,对于属于多式综合语的汉藏语来说,论元标记的描写是核心,因为大部分的语法现象都是围绕着论元标记展开的。 有关嘉绒语组的论元标记,还是烦请移步到这个答案看一两眼: 大家知道的语言里有哪些奇怪的语法? 除了嘉绒语组语言,不少其它汉藏语系语言都存在论元标记,而且有的还相当复杂,并且有比较大的类型学意义。比如基兰提语支的语言。在南部基兰提语支的 Puma 语中,不同人称的论元标记居然呈现了不同的排布[17]。如下表。 简单地说,第一人称作为 S(不及物动词主语)和 P(及物动词宾语)时,有采取同样的标记的情况;第二人称作为 A(及物动词主语)、P、S 时基本上都采用相同的标记,而第三人称则是作为 A 和 S 时,有采用相同的标记的情况。 这就表明,在 Puma 语中,第一人称更倾向于作格排布(ergative alignment),第二人称更倾向于中立排布(neutral alignment),而第三人称更倾向于宾格排布(accusative alignment)。观察到这个现象就出事儿了。基兰提语言拥有 1>2>3 的认同等第排序,而根据 Silverstein (1976)[18]的类型学研究,认同等第越高的人称,越有可能呈现宾格排布,而认同等第越低的人称,越有可能呈现作格排布。Puma 语的例子完全 Silverstein 的预测相反,因此是类型学上极其值得关注的案例。 总结 汉藏语系语言确实是一个类型学的大宝库。这些语言的类型学多样性不仅比我们熟知的其它语系更加清晰可见,比如我们一眼就可以看出有孤立语、黏着语和综合语分庭抗礼,其它语系则可能是其中一个类型较为有优势;同时,当我们进入细节中看,也有许许多多出人意料的语法现象。研究汉藏语系语言的一个乐趣就是给类型学家捣乱,在他们提出的任何类型学趋势或者 Universal,都有可能在汉藏语系的语言中找到反例。我之前说过,有两种类型学家,一种是 universalist,一种是 anti-universalist。汉藏语的专家可能更容易成为 anti-universalist。 现在很多类型学的学生在使用二手数据研究问题,不核对语料、不理解语料,不学习语言,他们的研究跟真实的语言就产生了一种隔膜,有不少研究中,对语料的解读很可能因为研究者的普通语言学基础薄弱而产生讹误。所以我觉得,致力于研究类型学的学生应该多向他们的前辈学习。要知道,类型学的老祖宗,Greenberg 可是认认真真地学习过美洲语言,并且在尼日利亚深入研究过豪萨语的;目前最红的类型学家,Haspel 数学老师,进行过相当多的本体研究,并且为 Lezgian(高加索)写过语法[19]。这些成功的类型学家都是脱胎于田野和语言本体,因此才能做出扎实的类型学研究。 阅读原文