【译文】世界上最快的语言是什么?
编辑让我回答这个问题–“世界上最快的语言是什么?”因为我既喜欢写语言,也喜欢写奇怪的、全球性的超级词汇。很快,我就意识到这个问题存在一个基本问题(尽管是个有趣的问题!):我们首先要确定 “最快 “到底是什么意思。是指在规定时间内说出的字数或音节数?传达的信息量?用最少的单词或音节来表达既定语句的语言?把语速调到最高时能让人听懂的语言?英语提高到 4 倍是什么?10x?
弗朗索瓦-佩莱格里诺(Francois Pellegrino)主要是一位定量语言学家,这意味着他的工作经常包括测量语言之间的差异,并寻找这些差异背后的解释。他曾多次研究语言速度,其中一项研究比较了 17 种不同语言的各种指标。
Pellegrino 更喜欢研究音节,而不是单个声音(语言学家称之为音素)或单词。”他说:”因此,你有两种方法来研究每个音节的发音。”你有一种方法,那就是看它们发出的速度有多快,以及它们传达了什么样的信息。但基本上,你也可以让人们听未知的语言,问他们听起来快不快。因此,你有感知方面的问题,也有发音和制作方面的问题”。
有一大堆指标可以用来衡量这些东西。佩莱格里诺的团队决定采用 “标准 “发音,因此即使说话者发音为 “probly”,”probably “一词也会被记为三个音节。
然后是 “信息密度”,理论上指的是每秒传递的信息量。这就更难了,实际定义起来绝对是个噩梦。克劳德-香农(Claude Shannon)设计了一种技术含义,基本上涉及听众如何快速减少对所获信息的不确定性。这包括计算语言中可能出现的音节数量、每个音节的相对流行程度以及某个音节紧跟另一个音节的概率。所有香农的东西都有点抽象,涉及到很多数学知识,老实说,让我头疼不已。
像佩莱格里诺这样的语言学家发现,基本上,一秒钟能说多少音节与一秒钟能说多少信息之间存在着反比关系。例如,日语每秒的音节数量极高。但日语音节的复杂程度也极低,每个音节编码的信息量也少得多。因此,音节发出的速度较快,但要传达与越南语等慢速语言相同的信息量,就需要更多的音节。
但你也可以说,像越南语甚至英语这样的语言比日语更有效率。日语音节大多包含一个辅音后跟一个元音,如 ko,而且日语只有五个元音。英语虽然有五个字母代表元音,但却有大约 20 种不同的元音。只需在不同的地方使用 “A”,我们就可以得到 “cat”、”can”、”cane”、”calm “等元音。英语中的单音节可能极其复杂:”strength”(力量)一词就包含了一大堆恼人的辅音。越南语则更进一步,增加了声调,因此音节的音调或音高也有价值。(日语有一个强调某些音节的系统,但一般不被视为音调语言)。一般来说,一个音节的复杂程度越高,所包含的信息就越多。日语的语速比英语快–每秒大约 12 个音节,对于语速特别快的人来说甚至可能更快–但是如果英语可以用五个音节传达同样的信息,日语真的 “更快 “吗?
在某个音节中透露多少 “信息 “的概念也很模糊。语言是混乱的、不一致的、多余的。英语句子 “I am “直接翻译成西班牙语就是 “Yo soy”。但 “yo “并不是必须的,事实上,通常会被省略。
在希伯来语中,”to be “没有动词,所以要表达你饿了,你可以说 “אני רעב”,意思是 “我饿了”。这个希伯来语的例子很好,因为 “hungry “这个词实际上涉及到性别;女人会说 “אני רעבה”,这就多了一个音节,但也多了一层意思。对于 “一个人 “来说,英语和希伯来语的音节数相同,但要真正表达希伯来语中的所有信息,英语就必须说得更像 “我,一个人,饿了”,这就更长了。
有时,信息量可能会更加密集。在瓦努阿图的一个岛上使用的帕姆语中,所有格可以包含说话人与对象之间关系的信息。”我的椰子 “不仅仅是 “我的椰子”。我的 “一词的意思可以是 “我的椰子,我打算吃它”,或 “我的椰子,我种的”,或 “我的椰子,我打算在家里以某种方式使用它,而不是吃或喝”。这比英语版本更有效地利用了篇幅!因此,从某种意义上说,它是否 “更快”?
即使在英语中,我们也可以把 “I am “缩写成 “I’m”,尽管许多缩写实际上并不节省音节(”should’t “和 “should not “都是两个音节)。在所有语言中,都有可能删除大量音节,但仍能传达信息。语言的编码往往存在大量冗余,但这确实是有目的的。即使听者不习惯说话者的口音、听力不佳或没有注意听,也可以通过冗余来理解。如果你把一个句子编辑到绝对最低限度,就需要相当集中的注意力和适当的环境才能理解,甚至可能做出一些有根据的猜测,知道说话者想要表达什么。
这就是说,语言的变数太多,也许不可能说哪种语言最快。但是,我们可以从不同的角度来研究这个问题,就像裁缝为客户量体裁衣一样,从而获得一些非常有趣的信息。
佩莱格里诺和其他几位研究人员于 2019 年发表了一篇论文,在理解克劳德-香农数学的一小部分人中引起了广泛关注。这篇论文发现,就每秒说出的音节数量而言,所研究的 17 种语言中速度最快的是日语、西班牙语和巴斯克语。最慢的是粤语、越南语和泰语。
但是!我只想解释一下:最快的三种语言都只有五个元音。最慢的三种语言有多达 20 个元音,而且都是声调语言,这意味着这些语言有大量可能的音节。
佩莱格里诺发现,考虑到所有因素,所有语言传递信息的速度基本相同:约为每秒 39 比特。每秒音节数越高,信息密度就越低,这就形成了一种权衡,使所有语言的信息传输速率大致相同。
佩莱格里诺没有研究几个相当著名的语系中的任何语言。斯瓦希里语和阿拉伯语的缺席让一些观察者感到惊讶,不过要对所有 7000 多种语言进行测量可能并不可行。还有一个基本问题,佩莱格里诺也承认,要真正弄清 “意义 “包括哪些内容非常困难。他所使用的香农理论并不完全是关于 “意义 “的,而是与不确定性相关的 “信息 “的一个非常具体的定义,这……嗯,并不完美,而且我的头又疼了。
另一个可能提供额外数据的因素是语言学家所说的 “prosody”,即语音的语调和节奏。我们的分析是否包括停顿?(佩莱格里诺没有;停顿不适用于他所研究的特定速度)。那么节奏呢?有趣的是,有些语言,如日语和西班牙语,更接近于让每个音节占用相同的时间长度。但日语也有一些非常精细的方法来填补不确定的空间。
语言有很多要素,不可能用 “速度 “这样的单一指标来涵盖所有这些方面。这有点像问 “哪个国家最好?”。答案会因问题中未指明的各种变量而改变。但这并不是说试图回答这个问题没有价值。
总之,最快的语言是日语。
本文文字及图片出自 What’s the Fastest Language in the World?
你也许感兴趣的:
- 初创企业需要懂得多少门语言
- 用什么样的语言就有什么样的公司
- 具有魔法的 H.264
- 多用户环境中的 rootless Docker
- 【外评】微软的人工智能聊天机器人将 “回忆 “您在其新 PC 上所做的一切
- 【外评】苹果需要解释重新出现已删除照片的错误
- 你需要知道的现代 CSS 技巧(2024 年春季版)
- 使用 :has() 作为 CSS 父选择器及其他更多内容
- 【外评】大科技公司致欧盟:“去死”
- npm又被滥用,灰产用《庆余年2》盗版资源——把开源公共基础设施的羊毛薅秃了
你对本文的反应是: