1. XenForo 1.5.14 中文版——支持中文搜索!现已发布!查看详情
  2. Xenforo 爱好者讨论群:215909318 XenForo专区

stone和石头一词读音神似,有什么联系吗?

本帖由 漂亮的石头2021-09-04 发布。版面名称:知乎日报

  1. 漂亮的石头

    漂亮的石头 版主 管理成员

    注册:
    2012-02-10
    帖子:
    486,278
    赞:
    46
    [​IMG] 小云哥哥,语言学男博士,专门研究汉藏语系的语言 阅读原文

    这个问题这两天每天都蹦出来,乍一看是个不想回答的问题,但是看到有很多有深度的讨论以及搞笑的回答,我看看我能不能蹭蹭热度说两句好了。

    应该给这个类型的问题来个了断。

    @下北泽慧音 曾经给我看过一篇博客文章,我觉得写得非常好,当时我们想把这篇文章翻译翻译,但一来觉得太长,二来怕数学上的东西讲得不够严谨贻笑大方,所以大家可以自己去看原文。Thomas Pellard 认为每一个历史语言学的学生都应该读这篇文章。

    How likely are chance resemblances between languages?

    这篇文章的第一句就很引人入胜,作者开篇就说很多人喜欢把关系遥远的语言中,某些长相相似的词汇列举出来,并声称这些相似“绝不是巧合”,因为有“太多”的“同源词”。而当语言学家耐心地给他们解释的时候,他们却往往并不会被说服。

    但你找到的“同源词”,真的“绝不是巧合”吗?两个语言中,含有相似词汇的概率究竟能有多大?要不要算一算?其实不是很难算。我们可以用二项式概率(binomial probability)来计算,在 n 个词中,有 r 个相似词汇的概率:

    [​IMG]

    假设有 1000 个词吧,n=1000,那么从 1 到 6 个相似词汇的概率分别是:

    p(1) = 0.368
    p(2) = 0.184
    p(3) = 0.0613
    p(4) = 0.0153
    p(5) = 0.00305
    p(6) = 0.000506​

    那么,我们在 1000 个词汇中找到 1 到 6 个相似词汇的概率就是把以上的 p 都加起来,即 0.632。也就是说,你有超过六成的可能在两个毫不相关的语言中找到 1 到 6 个所谓“同源词”。

    因此,如果你在汉语和阿萨巴斯坎语中找到一两个形状相似、意思相近的词,我完全不会惊讶。

    这篇博客后边的部分很精彩,有兴趣可以自己去看一下。已经看过的可以分享一下心得。


    当然,如果题主没有受到过任何历史语言学的训练,我们谁也不应该批评题主,反而应该鼓励一下。因为毕竟有更多的人完全不会去考虑语言的问题。不过,同时在尊重事实的原则下,要提醒题主,这样的比较在 21 世纪的今天是落后的,甚至 20 世纪、19 世纪、18 世纪,一直退回到 9 世纪,可能都是落后的。为什么?

    9 世纪的北非大陆,早就有人对语言的相关性作出了虽然初步但较为准确的比较。今天阿尔及利亚的提亚雷德,当年是鲁斯塔米德王朝的都城。犹大·伊本·库莱什(希伯来语:Yhvdh Abn Qrysh;阿拉伯语:Yhwḏā Bn Qryš)就出生在这里。据说他原来是个医生[1]。他是犹太人,当然笃信犹太教,并对宗教事务非常热心。有一天,他听说非斯(今天摩洛哥境内)的犹太人居然废止了《希伯来圣经》塔古姆(Trgvm)译本的使用。塔古姆指的就是用当地语言翻译的《圣经》。我们知道,犹太人是一个不能以语言定义的群体,因为分布在世界各地的犹太人使用不同的语言,在阿拉伯世界居住的犹太人,自然以当地的阿拉伯语为母语。如果一旦废除了塔古姆,当地的犹太人就面临着不能阅读《圣经》的危险,毕竟学习希伯来语也是一件不容易的事儿。库莱什认为塔古姆也是犹太教的优良传统,是从古至今人们一直在使用的,并没有对犹太教的传承造成问题,反而有推动作用。

    于是库莱什就写了一封长信给在非斯的犹太教信众。在这封长信里,伊本·库莱什为了解释各种语言的重要性,他为语言进行了历时的纵向比较和共时的横向比较。他比较了《希伯来圣经》中所用的希伯来语与《塔木德》和《米书拿》中所用 的希伯来语,又把这些书面希伯来语与当代希伯来语进行比较; 同时,他还拿希伯来语跟阿拉姆语和阿拉伯语作了比较。其中,与阿拉伯语的比较尤为系统,占了一章的篇幅。伊本·库莱什总结出 561 个在希伯来语中与阿拉伯语相似的词汇,比如说希伯来语的 dimʕā“眼泪”和阿拉伯语的 damʕa“眼泪”;或者希伯来语和阿拉伯语相对应 的字母,比如在希伯来语出现 yod 的这个字母,阿拉伯语必然是 wāw,希伯来语的 shin 必然对应阿拉伯语的 sīn 或 thā,而希伯来语的 sīn,对应阿拉伯语的 shīn,等等。伊本·库莱什又发现,希伯来、阿拉姆和阿拉伯三种语言动词的词缀都差不多,都分别使用互相对应的ʔ-、y-、t-、n- 作为人称前缀,又使用 -t、-m、-n、-y、-w 作为人称后缀[2]。

    我们可以发现,伊本·库莱什所做的事情,已经跟十个世纪以后的历史语言学家做的事有点相像了,他在找对应关系。是的,当我们怀疑两种语言有同源关系的时候,我们不是把相似的词汇挑出来,而是要比较它们音位之间的对应,只有找到对应关系才能让人信服。一千二百年前的伊本·库莱什已经意识到这点并付诸实践,所以我们在一千二百年前已经可以有点相信闪米特语系的存在了。

    在这个意义上,伊本·库莱什比后世十七世纪的马克·苏埃利奥· 范·博思瀚(Marcus Zuerius van Boxhorn),十八世纪的蒙博杜勋爵(Lord Monboddo)以及大名鼎鼎的威廉·琼斯爵士(Sir William Jones)更加高明,而且还领先了人家将近千年。

    因此,如果说对历史语言学感兴趣,那么就必须知道前人做了什么、怎么做的,什么路行得通,我们要走下去并在此基础上发展出更好的更有效的东西。

    我们不要被九世纪的人比下去了。


    整齐的对应关系可以大大降低语言比较的偶然性。当然,我们还可以使用别的方法加以佐证,尤其是在我们确信两者同源,但因为对语言的理解还不够难以得出整齐对应关系的时候。比如我们可以寻找双音节词或者多音节词。如果是单音节词的相似更容易处于偶然,那么双元音词或者多音节词相似出于偶然的概率就要小得多。

    沙加尔和徐世璇(2002)在讨论哈尼语中的汉语借词的历史层次时,重点指出了双音节词的重要性,当然他们是在讨论借词层次的判别,同源词的判别亦然[3]:

    双音节词的另一个作用是将偶然相似的可能性减小到最低限度,在汉藏语言范围内实际上消除了将同源词误作借词的危险。​

    在 Lai et al (2020)寻找西夏语和西部嘉绒语组语言的共同创新时,他们也重点寻找了双音节词的同源词。具体可以参考:

    西夏语属于嘉绒语的一支吗?具体哪一支?为什么?

    只是,在使用双音节词的时候,我们需要对所研究的语言有一定的知识,综合各方面考虑,才能下结论。虽然“石头”是双音节词,但是…… 但是后边的话就不想多说了。


    还有一个较为重要的点是,我们在比较语言的时候,一定要考虑到语言的形态。比如说“石头”这个词的词源是较为透明的,是“石”和“头”两个部分组成,各有其原义,是一个复合词。而 stone 则不能拆成“相对应”的 s 和 tone,一个表示“石”,一个表示“头”。相信很多别的答主都已经讲了这些词的词源了。

    形态的变化加上语音的变化,会使很多词汇的结构变得模糊,甚至把几个音节缩成一个音节。这时,我们就有很大的可能看不出它跟某一个其它语言的词是同源词。所以我们首先需要把这个词汇的来源研究出来,才能水落石出。比如说,法语的ʃɛn,只有一个音节,如果你对法语本身的历史完全没有了解,你根本不会把它跟西班牙语的 kaˈðena 联系在一起。

    在很多汉藏语系的语言中,尤其是那些形态较少、语法接近孤立语的语言,有很多词汇很可能包含了许多派生的过程,比如上古汉语(白沙)食 *s-m-lək-s > sì (箪食壶浆的“食”),根据白沙的说法,可能经历了三次派生,而今天我们只看到一个简简单单的音节,如果我们不把它还原成上古汉语,我们能知道它可能跟绰斯甲语的 njæ̂ʁ '舔'、藏语ལྡག་ ldag 有关系吗?然后有些人可能会把它跟英语的 lick 比较,然后我就不 comment 了。

    不针对对象语言进行深入地研究和学习,就想做历史语言学的比较。这是不可能的。

    我在硕士的时候,有一个老师叫 Jean Léo Léonard,在一次历史语言学的课上,面对某一个抬杠的学生(我们在讲罗曼语的历史,基本上都是定论),他说:

    你来这里不仅仅是练习方法,而且是来学习的。​

    言下之意,你在这堂课上没有 opinion。是的,不学习,就没有 opinion。


    当然,说到最后,我也是胡乱比较的一份子,还随手画成了漫画。比如可以看看这个回答:

    不同国家或民族语言有什么有趣的巧合?

    阅读原文
     
正在加载...