stone和石头一词读音神似，有什么联系吗？

漂亮的石头 · 2021-09-04

小云哥哥，语言学男博士，专门研究汉藏语系的语言阅读原文

这个问题这两天每天都蹦出来，乍一看是个不想回答的问题，但是看到有很多有深度的讨论以及搞笑的回答，我看看我能不能蹭蹭热度说两句好了。

应该给这个类型的问题来个了断。

@下北泽慧音曾经给我看过一篇博客文章，我觉得写得非常好，当时我们想把这篇文章翻译翻译，但一来觉得太长，二来怕数学上的东西讲得不够严谨贻笑大方，所以大家可以自己去看原文。Thomas Pellard 认为每一个历史语言学的学生都应该读这篇文章。

How likely are chance resemblances between languages?

这篇文章的第一句就很引人入胜，作者开篇就说很多人喜欢把关系遥远的语言中，某些长相相似的词汇列举出来，并声称这些相似“绝不是巧合”，因为有“太多”的“同源词”。而当语言学家耐心地给他们解释的时候，他们却往往并不会被说服。

但你找到的“同源词”，真的“绝不是巧合”吗？两个语言中，含有相似词汇的概率究竟能有多大？要不要算一算？其实不是很难算。我们可以用二项式概率（binomial probability）来计算，在 n 个词中，有 r 个相似词汇的概率：

$[IMG]$

假设有 1000 个词吧，n=1000，那么从 1 到 6 个相似词汇的概率分别是：

p(1) = 0.368
p(2) = 0.184
p(3) = 0.0613
p(4) = 0.0153
p(5) = 0.00305
p(6) = 0.000506

那么，我们在 1000 个词汇中找到 1 到 6 个相似词汇的概率就是把以上的 p 都加起来，即 0.632。也就是说，你有超过六成的可能在两个毫不相关的语言中找到 1 到 6 个所谓“同源词”。

因此，如果你在汉语和阿萨巴斯坎语中找到一两个形状相似、意思相近的词，我完全不会惊讶。

这篇博客后边的部分很精彩，有兴趣可以自己去看一下。已经看过的可以分享一下心得。

当然，如果题主没有受到过任何历史语言学的训练，我们谁也不应该批评题主，反而应该鼓励一下。因为毕竟有更多的人完全不会去考虑语言的问题。不过，同时在尊重事实的原则下，要提醒题主，这样的比较在 21 世纪的今天是落后的，甚至 20 世纪、19 世纪、18 世纪，一直退回到 9 世纪，可能都是落后的。为什么？

9 世纪的北非大陆，早就有人对语言的相关性作出了虽然初步但较为准确的比较。今天阿尔及利亚的提亚雷德，当年是鲁斯塔米德王朝的都城。犹大·伊本·库莱什（希伯来语:Yhvdh Abn Qrysh;阿拉伯语:Yhwḏā Bn Qryš）就出生在这里。据说他原来是个医生[1]。他是犹太人，当然笃信犹太教，并对宗教事务非常热心。有一天，他听说非斯（今天摩洛哥境内）的犹太人居然废止了《希伯来圣经》塔古姆（Trgvm）译本的使用。塔古姆指的就是用当地语言翻译的《圣经》。我们知道，犹太人是一个不能以语言定义的群体，因为分布在世界各地的犹太人使用不同的语言，在阿拉伯世界居住的犹太人，自然以当地的阿拉伯语为母语。如果一旦废除了塔古姆，当地的犹太人就面临着不能阅读《圣经》的危险，毕竟学习希伯来语也是一件不容易的事儿。库莱什认为塔古姆也是犹太教的优良传统，是从古至今人们一直在使用的，并没有对犹太教的传承造成问题，反而有推动作用。

于是库莱什就写了一封长信给在非斯的犹太教信众。在这封长信里，伊本·库莱什为了解释各种语言的重要性，他为语言进行了历时的纵向比较和共时的横向比较。他比较了《希伯来圣经》中所用的希伯来语与《塔木德》和《米书拿》中所用的希伯来语，又把这些书面希伯来语与当代希伯来语进行比较; 同时，他还拿希伯来语跟阿拉姆语和阿拉伯语作了比较。其中，与阿拉伯语的比较尤为系统，占了一章的篇幅。伊本·库莱什总结出 561 个在希伯来语中与阿拉伯语相似的词汇，比如说希伯来语的 dimʕā“眼泪”和阿拉伯语的 damʕa“眼泪”；或者希伯来语和阿拉伯语相对应的字母，比如在希伯来语出现 yod 的这个字母，阿拉伯语必然是 wāw，希伯来语的 shin 必然对应阿拉伯语的 sīn 或 thā，而希伯来语的 sīn，对应阿拉伯语的 shīn，等等。伊本·库莱什又发现，希伯来、阿拉姆和阿拉伯三种语言动词的词缀都差不多，都分别使用互相对应的ʔ-、y-、t-、n- 作为人称前缀，又使用 -t、-m、-n、-y、-w 作为人称后缀[2]。

我们可以发现，伊本·库莱什所做的事情，已经跟十个世纪以后的历史语言学家做的事有点相像了，他在找对应关系。是的，当我们怀疑两种语言有同源关系的时候，我们不是把相似的词汇挑出来，而是要比较它们音位之间的对应，只有找到对应关系才能让人信服。一千二百年前的伊本·库莱什已经意识到这点并付诸实践，所以我们在一千二百年前已经可以有点相信闪米特语系的存在了。

在这个意义上，伊本·库莱什比后世十七世纪的马克·苏埃利奥· 范·博思瀚（Marcus Zuerius van Boxhorn），十八世纪的蒙博杜勋爵（Lord Monboddo）以及大名鼎鼎的威廉·琼斯爵士（Sir William Jones）更加高明，而且还领先了人家将近千年。

因此，如果说对历史语言学感兴趣，那么就必须知道前人做了什么、怎么做的，什么路行得通，我们要走下去并在此基础上发展出更好的更有效的东西。

我们不要被九世纪的人比下去了。

整齐的对应关系可以大大降低语言比较的偶然性。当然，我们还可以使用别的方法加以佐证，尤其是在我们确信两者同源，但因为对语言的理解还不够难以得出整齐对应关系的时候。比如我们可以寻找双音节词或者多音节词。如果是单音节词的相似更容易处于偶然，那么双元音词或者多音节词相似出于偶然的概率就要小得多。

沙加尔和徐世璇（2002）在讨论哈尼语中的汉语借词的历史层次时，重点指出了双音节词的重要性，当然他们是在讨论借词层次的判别，同源词的判别亦然[3]：

双音节词的另一个作用是将偶然相似的可能性减小到最低限度，在汉藏语言范围内实际上消除了将同源词误作借词的危险。

在 Lai et al (2020)寻找西夏语和西部嘉绒语组语言的共同创新时，他们也重点寻找了双音节词的同源词。具体可以参考：

西夏语属于嘉绒语的一支吗？具体哪一支？为什么？

只是，在使用双音节词的时候，我们需要对所研究的语言有一定的知识，综合各方面考虑，才能下结论。虽然“石头”是双音节词，但是…… 但是后边的话就不想多说了。

还有一个较为重要的点是，我们在比较语言的时候，一定要考虑到语言的形态。比如说“石头”这个词的词源是较为透明的，是“石”和“头”两个部分组成，各有其原义，是一个复合词。而 stone 则不能拆成“相对应”的 s 和 tone，一个表示“石”，一个表示“头”。相信很多别的答主都已经讲了这些词的词源了。

形态的变化加上语音的变化，会使很多词汇的结构变得模糊，甚至把几个音节缩成一个音节。这时，我们就有很大的可能看不出它跟某一个其它语言的词是同源词。所以我们首先需要把这个词汇的来源研究出来，才能水落石出。比如说，法语的ʃɛn，只有一个音节，如果你对法语本身的历史完全没有了解，你根本不会把它跟西班牙语的 kaˈðena 联系在一起。

在很多汉藏语系的语言中，尤其是那些形态较少、语法接近孤立语的语言，有很多词汇很可能包含了许多派生的过程，比如上古汉语（白沙）食 *s-m-lək-s > sì （箪食壶浆的“食”），根据白沙的说法，可能经历了三次派生，而今天我们只看到一个简简单单的音节，如果我们不把它还原成上古汉语，我们能知道它可能跟绰斯甲语的 njæ̂ʁ '舔'、藏语ལྡག་ ldag 有关系吗？然后有些人可能会把它跟英语的 lick 比较，然后我就不 comment 了。

不针对对象语言进行深入地研究和学习，就想做历史语言学的比较。这是不可能的。

我在硕士的时候，有一个老师叫 Jean Léo Léonard，在一次历史语言学的课上，面对某一个抬杠的学生（我们在讲罗曼语的历史，基本上都是定论），他说：

你来这里不仅仅是练习方法，而且是来学习的。

言下之意，你在这堂课上没有 opinion。是的，不学习，就没有 opinion。

当然，说到最后，我也是胡乱比较的一份子，还随手画成了漫画。比如可以看看这个回答：

不同国家或民族语言有什么有趣的巧合？

阅读原文

登录或注册

stone和石头一词读音神似，有什么联系吗？

漂亮的石头版主管理成员

登录或注册

stone和石头一词读音神似，有什么联系吗？

漂亮的石头 版主 管理成员

漂亮的石头版主管理成员