切罗基音节文字及其表音策略

原文链接(首发于十五言社区)

对于习惯了拉丁字母的大多数世界人民来说,切罗基音节文字可能是现存文字中最别扭的一种了。


切罗基音节文字(Cherokee syllabary)是美国原住民切罗基人的语言——切罗基语——所使用的文字。大概因为是美国的原住民语言文字,所以 iOS 系统自带了切罗基语输入法(即「彻罗基文」)。大家有兴趣的话可以自己在手机上调出该输入法先感受一下,看起来是不是非常别扭呀?如果感觉别扭就请往下看吧,因为这是一篇吐槽切罗基音节文字的文章。


当今世界各种语言所用的文字基本可以分为语素文字表音文字两大类。

汉字是唯一一种仍被广泛使用的语素文字;也就是说,绝大多数文字是表音文字。

表音文字又可以粗略地分为四类:一是全音素文字,表示辅音和表示元音的符号无差别地体现,如西里尔字母、希腊字母,还有当今世界最强势的文字——拉丁字母等。二是辅音音素文字,主要体现表示辅音的符号而很少体现表示元音的符号,如阿拉伯字母、希伯来字母。三是元音附标文字,表示辅音和表示元音的符号基本都体现,但辅音符号是书写主体,而元音符号附标在辅音符号上,如天城体、藏语字母等。四是音节文字,单个符号就能表示音节(通常也包括单独的元音),但很少有表示辅音的符号,如假名(表示辅音的假名只有ん或ン,表示/n/)、切罗基音节文字(表示辅音的切罗基音节文字只有Ꮝ,表示/s/)等。

正如上文所说,假名和切罗基音节文字都属于音节文字;这两种文字长得完全不一样,但在表音策略上是有一定相似性的。

虽然假名是音节文字,但「五十音图」还是使用辅音和元音相组合的方式为我们很直观地展示了假名的发音。


切罗基音节文字及其表音策略_第1张图片
五十音图(图源维基百科)


而切罗基音节文字也有一个形式上类似的字母 [1]表。


切罗基音节文字及其表音策略_第2张图片
切罗基音节文字字母表(图源维基百科);该字母表所采用的拉丁转写是基于拼写的伍斯特式转写(Worcester transliteration)


粗看起来,这两种文字除了字形长得完全不一样,以及切罗基语多了一个鼻化元音和几个辅音(群)以外,在实际使用中似乎没有太大的差别。甚至,在阅读了维基百科上和切罗基语相关的条目后,仍然会有这种错觉。

啊,如果真的是这样的话,我这篇文章到这里差不多就该结束了。


前面大家已经对文字、音节文字,还有切罗基音节文字有了最基础的了解,那么,下面我们就进入正题吧。

一、切罗基音节文字为什么长得这么奇怪

当前全体美洲人民所使用语言(包含原住民语言和作为国家、地区级官方语言的外来语言)的种类,按 ethnologue 的统计,共有1064种,这其中大部分是原住民语言。

美洲的语言种类虽然很多,但仍处于使用中的文字种类却非常少。这1064种语言——除了部分原住民语言还没有正式的文字外——只使用了三种文字:一种当然是拉丁字母,美洲绝大多数语言——包括所有作为国家、地区级别官方语言的外来语言,和绝大多数有文字的原住民语言——都使用它;另一种就是本文要讲的切罗基音节文字;还有一种是加拿大原住民音节文字:ᕕ( ᐛ )ᕗ,这个颜文字里除了括号以外的另外三个符号都属于加拿大原住民音节文字,关于加拿大原住民音节文字本文就不再赘述了。

切罗基音节文字的发明者是切罗基本族人塞阔雅(Sequoyah, 1770 - 1840);这也使得切罗基音节文字成为美洲唯一一种还在使用的、原住民自己创造的文字(加拿大原住民音节文字的发明者是英国-加拿大传教士 James Evans)。

简单说来,塞阔雅是接触了欧洲(裔)人的书籍后产生创造文字的想法的。但他完全不懂欧洲人的文字,所以只是参考了拉丁字母、阿拉伯数字等文字符号的字形,其创造的新文字的发音则与对应相似的拉丁字母等毫无关系——比如和拉丁字母 W 相似的切罗基音节文字有两个,一个是表示/la/的Ꮃ,一个是表示/tʰa/的Ꮤ——再加上我们普遍都很熟悉拉丁字母及其发音,这就造成了看切罗基音节文字如看越南字喃的违和感——远看都认识,仔细一看,就别说看不看得懂了,连读都读不出来。

与之形成对比的是傈僳语使用的富能仁字母,虽然里面也有一些看起来怪怪的字母,但毕竟它的发明者是英国传教士富能仁(James Outram Fraser, 1886 - 1938),所以其中的大多数字母的发音和对应的拉丁字母还是相似的;放一段富能仁字母书写的傈僳语,即使看不懂,也能读个大概吧。


切罗基音节文字及其表音策略_第3张图片
富能仁字母(图源维基百科)


二、切罗基音节文字的表音策略

对于普通国人来说,「语言」和「文字」似乎是两个相似甚至相等的概念,比如,「中文」和「汉语」的含义并没有多少差别。但实际上,「语言」和「文字」的之间的关联更多是文化上的。理论上来说,「语言」和「文字」没有任何关系。嗯,没有任何关系。在规范好了正字法的前提下,任何语言都可以用任何文字来书写。

印度尼西亚一支原住民的语言,吉阿吉阿语(Cia-Cia),属于南岛语系。南岛语系一些相对强势的语言,如马来语、印尼语、(菲律宾的)他加禄语、(马达加斯加的)马拉加什语等,都使用拉丁字母。吉阿吉阿语现在也使用的拉丁字母,但在2009年至2012年间,它却使用了谚文作为自己的文字,对,就是韩语的谚文。然而,无论使用谚文或是拉丁字母书写,都并不影响它是 CIA 的语言(误)。


切罗基音节文字及其表音策略_第4张图片
使用谚文书写的吉阿吉阿语教材(图源维基百科)


再比如,越南语曾经使用基于汉字的字喃,现在使用拉丁字母;土耳其语曾经使用阿拉伯字母,现在使用拉丁字母。这两种语言的本质并没有变。

再比如,上文提到过的,美洲绝大多数有文字的原住民语言都使用的拉丁字母——这些语言本身和欧洲的印欧语有多大关系呢?玛雅语系诸语言曾经使用着语素文字玛雅文字,今天不照样也用拉丁字母?

而切罗基语和切罗基音节文字虽然是世界语言中少见的互为映射的关系,但是,如果不考虑切罗基音节文字的文化价值(美洲唯一一种还在使用的、原住民自己创造的文字),切罗基语根本不应该使用切罗基音节文字。切罗基语复杂的语音规则和切罗基音节文字死板的表音功能这么一结合,使得它们成为了可能是对非母语者最不友好的语言和文字之一。

切罗基语的阻碍音全是清音,送气对立(少数几个阻碍音没有送气对立,如 /s/),和普通话一样。也就是说,在伍斯特式转写里,字母 g 实际表示 /k/,字母 k 实际表示 /kʰ/ [2](这和拼音 g 与 k 所表示的发音是一样的 [3]),以此类推。

仔细看一下本文中的切罗基音节文字字母表——不用全看,就看第二行,即 g/k 行。第二行有七个文字,分别是表示 /ka/ 的Ꭶ,/kʰa/ 的Ꭷ,/ke/ 的Ꭸ,/ki/ 的Ꭹ,/ko/ 的Ꭺ,/ku/ 的Ꭻ,/kə̃/ 的Ꭼ。这么看来,似乎切罗基语里的 /kʰ/ 只能和元音 /a/ 组合而不能和其余五个元音组合。

但是情况并非如此。除了唇音 /m/ 不能和鼻化元音 /ə̃/ 组合以外,切罗基语的任何辅音都可以和任何元音组合。也就是说,并不是 /kʰ/ 不能和其余五个元音组合,而是切罗基音节文字在书面上并不区分 /kʰ/ 或 /k/ 分别与其余五个元音的组合,即 /kʰe/ 和 /ke/ 都写为Ꭸ,/kʰi/ 和 /ki/都写为Ꭹ,以此类推。

下面的部分文字也是如此。比如 d/t 行(拼音 d 和 t ),切罗基音节文字在书面上区分 /tʰa/ 和 /ta/、/tʰe/ 和 /te/,以及 /tʰi/ 和 /ti/,但不区分 /tʰo/ 和 /to/、/tʰu/ 和 /tu/,以及 /tʰə̃/ 和 /tə̃/。甚至在 ts 行,切罗基音节文字在书面上完全不区分 /t͡s/(拼音 z)和 /t͡sʰ/(拼音 c)——而且 ts 行的实际情况比送气对立还更复杂。 ts 行潜在的辅音有四个,分别是 /t͡s/ 和 /t͡sʰ/,以及 /t͡ʃ/(英语 chair 的 ch)和 /t͡ʃʰ/,其中不送气的 /t͡s/ 和 /t͡ʃ/ 是自由音变的同位异音;也就是说,实际音位有三个,而这三个音位,切罗基音节文字在书面上完全不区分。

那么书面上不区分送气对立有什么影响呢?如果汉语普通话的「肚子」和「兔子」写出来完全一样,会有什么影响呢?

切罗基语作为一种复式综合语,有时一个词语就是一个完整句子,这往往能引起更大的歧义。比如,表示「你做了这件事」的 /ha˨tə̃ː˧˩ka˨/ [4],和表示「你把它挂起来了」的  /ha˨tʰə̃ː˧˩ka˨/,用切罗基音节文字写出来都是ᎭᏛᎦ,需要读者根据语境来自行辨析。如果没有上下文,那么就没人知道它到底是几个意思。

这是切罗基音节文字的第一个槽点:音系里辅音送气对立,但在书面体现得很少。

实际上,塞阔雅肯定也意识到了区分送气和不送气的必要性。比如,他之所以区分表示 /ka/ 的Ꭶ和表示 /kʰa/ 的Ꭷ,主要是因为 /ka/ 大概是切罗基语里最常见的一个音节:切罗基语的三人称单数代词前缀就是 ga- [5]。这个代词前缀大概相当于英语的 it、he 还有 she,但其在切罗基语里的曝光率可能比这三个词在英语里的曝光率总和还要高。因为即使句子的三人称单数主语以名词的形式出现了,句子的谓语动词仍然要带上这个前缀。但对于其他一些送气和不送气的曝光率都不高的音节,作为一个母语者,塞阔雅显然就不是很敏感了。

此外,切罗基语还有一个辅音是根本不在书面体现的,即声门塞音 /ʔ/。这个音在普通话音系里也有,并且也不体现在书面上。不过普通话里的声门塞音是可预见的。比如「西安」这个词,如果「西」和「安」之间不插入一个声门塞音,那发音就会变成「先」了。而切罗基语里的声门塞音是可能出现于元音和辅音之间的,并且——和普通话相反——是不可预见的。如ᎠᏓ,如果发 /a˦ʔta˨/,表示「幼小的动物」,但如果发 /a˨ta˨/,就表示「木头」了(虽然声调的不同使得这两个词语并没有构成最小对,但声调的不同和/ʔ/的出现并没有关系)。

这是切罗基音节文字的第二个槽点:一个和其他辅音同样重要的辅音,根本不在书面体现。

说了辅音,我们再来说说元音。

从文章开头的字母表看来,切罗基语似乎只比日语多一个元音。但我前面已经使用过国际音标来表示切罗基语的发音了,正如你所见,切罗基语的元音是分长短的,并且,和大多数美洲原住民语言一样,切罗基语还是声调语言。它有六个声调,两个调值不变的简单声调可以出现于长元音和短元音,四个调值变化的组合声调只出现于长元音。

也就是说,随意一个元音文字,比如Ꭰ,可以表示八种不同音位。虽然简单声调中的低声调是切罗基语中的默认声调;通常一个词里——尤其是较长的词里——有一半以上的音节是低声调,但仅以声调对立的最小对还是存在的。比如ᏕᎾᏑᎴᏍᎪ,若是读作 /teː˦na˨suː˨leː˨sko˨/(第一个音节是高声调,其余音节都是低声调),那么它表示「我们洗手」;而如果读作 /teː˦na˨suː˨leː˦sko˨/(第一和倒数第二个音节是高声调,其余音节都是低声调;这两个词语是严格的最小对),那么它表示「我们脱裤子」。这也是需要读者根据语境来自行辨析的。要是没有上下文,那么也没人知道它到底是几个意思。

这是切罗基音节文字的第三个槽点:完全不体现元音的长短和声调。

如果看到这里还保持着兴趣,那么接下来我们来谈谈切罗基语复杂的语音规则吧——其实也不需要谈太细,切罗基音节文字的第四个槽点是:语音规则很复杂,但很少在书面体现。

粗略说来,切罗基语有以下三条最基础的语音规则:

一是和声门塞音 /ʔ/ 类似的、在发音中会出现却不在书面出现的 /h/。或许你会奇怪,字母表里不是有 h 行吗?是的,但 h 行里的 /h/ 都是出现于元音前的,而实际使用中,/h/ 还可能出现于辅音前或元音后,这些 /h/ 都是不在书面体现的;至于什么时候该发这些 /h/ 呢?这连上下文都帮不了我们了,完全靠猜吧。

二是低声调的短元音会在某些时候脱落。具体说来,当第一个音位是任何不送气辅音,第二个音位是低声调短元音,第三个音位是 /h/,第四个音位是塞音(对于切罗基语来说,就是声门塞音 /ʔ/,以及送气或不送气的 /kw/、/t/ 以及 /k/,共七个音)或塞擦音(对于切罗基语来说,就是上文提到过的送气或不送气的 /t͡s/ 和 /t͡ʃ/,其中不送气的两个音是同位异音,所以共三个音)或元音时,第二个音位上的低声调短元音就会消失掉,并且第一个音位上的不送气辅音会和第三个音位上的 /h/ 结合成其对应送气辅音。这一条看起来倒是有规矩可遵循,但因为前面提到过的槽点,送气对立很少在书面体现,以及元音的长短和声调都不体现,所以看到诸如ᎠᎩᏢᎦ这样的词语(第三个文字,Ꮲ,按伍斯特转写本来是tlv,/tlə̃/,但它在这里实际上是带有 /h/ 的,嗯,就是第一条语音规则里的那种情况,所以它的实际发音是 /htlə̃/;那么,就假设我们已经知道这里有个 /h/ 了吧),我们既不知道第二个文字到底表示 /ki/ 还是 /kʰi/,也不知道 i 到底是不是低声调短元音。暂且假定它是低声调短元音吧;如果Ꭹ表示 /kʰi/,那么整个词语就应该读作 /akʰihtlə̃ka/(因为这里主要在讲元音脱落,就暂且忽略掉声调了);而如果Ꭹ表示 /ki/,那么这个 i 就得脱落了,整个词语就应该读作 /akʰtlə̃ka/。

三是声门擦音/h/会在某些时候和其前面的低声调短元音交换位置。具体说来,当第一个音位是任何不送气辅音,第二个音位是低声调短元音,第三个音位是 /h/(前三个条件和上面提到的元音脱落的条件完全相同),第四个音位是任何响音(对于切罗基语来说,响音是送气或不送气的 /n/、/m/、/w/ 和 /j/,共八个音)时,第三个音位上的 /h/ 会和第二个音位上的元音交换位置。这一条也是看起来有规可循的,但操作起来也面临着第二条的问题。

此外,切罗基语还有一些关于声调的语音规则,同样也是不在书面体现的,这里就不再吐槽了。

三、表音功能弱弱的表音文字

切罗基音节文字是表音文字。表音文字和使用它的语言,理论上说,应该做到音形一致;即像西班牙语一样(西班牙语也没有达到严格的音形一致,但它是强势语言中音形一致性相对比较高的),一种发音(几乎)只能有一种写法,一种写法也(几乎)只能有一种发音。

然而,由于现实的残酷性,这个世界上的大多数自然语言并不能达到西班牙语级别的音形一致性。

最典型的例子当然就是英语啦,相信大家都深有体会,我这里也不再赘述。除了英语以外,藏语也是音形不一致的典型,而且藏语的音形不一致比英语严重得多。虽然有人用「I come here to die」(本来是 I come here today)来嘲笑澳洲人把 /eɪ/ 发成 /æɪ/,但至少前面大半句还能听懂吧。而藏语音形不一致甚至导致了藏语的拉丁转写方案有两个极端:一个是基于拼写的威利转写(Wylie transliteration),一个是基于发音(卫藏方言拉萨方言)的藏语拼音(Tibetan pinyin),两种转写的差别我也就直接用维基百科的例子好了。


切罗基音节文字及其表音策略_第5张图片
威利转写和藏语拼音对比(图源维基百科);这五个词分别是:日喀则、扎什伦布(寺)、哲蚌(寺)、确吉坚赞(第十世班禅)、土登嘉措(第十三世达赖)


即使不认识藏语字母,我们也可以从基于拼写的威利转写看到,藏语字母记录了近古藏语的辅音群;而我们又可以从基于发音的藏语拼音里看到,这些保留在文字里的辅音群在拉萨方言里几乎消失了。

那么这些辅音群在现代藏语里都消失了吗?并不是的。藏语有三大方言:主要用于西藏的卫藏方言、主要用于四川藏区、西藏东部的康方言以及主要用于青海藏区的安多方言。其中,安多方言保留了很多近古藏语的辅音群,这使得安多方言不需要声调,像英语等大多数欧洲语言一样;而卫藏方言和康方言由于辅音群不同程度地缺失,不得不使用声调来增加语音的辨识度,这和汉语是类似的。

需要注意的是,虽然英语和藏语的音形不一致程度很高,但毕竟英语从九世纪开始就使用拉丁字母了,期间又经历了以元音大迁移(Great Vowel Shift)为代表的一系列音变,正字法赶不上语音的变化;藏语则由于地理原因,方言高度多样化,并且藏语正字法是以存古为原则的,各地藏语方言虽然在口头上不通,写出来却都是一样的(也是和汉语类似)。这样看来,倒也都能够理解。

但切罗基人使用切罗基音节文字的时间并不长,只有两百多年;并且历史上切罗基人的分布地域比较小,也不存在什么地理隔离。当代的切罗基人的主要聚居地除了图上的红色区域外,还有俄克拉荷马州的部分地区,但这也是 19 世纪 30 年代「血泪之路」后的事了。

切罗基音节文字及其表音策略_第6张图片

切罗基人的历史分布地域

那么为什么切罗基音节文字的表音功能如此之差呢?

实际上,塞阔雅最初是企图为每个语素(词缀或词干)创造一个对应文字的,但切罗基语毕竟是复式综合语而不是少数综合语(oligosynthetic language),这文字要是创造出来了估计也得时时守着词典才能用——他后来也发现这个任务过于艰巨,这才把新文字改为了音节文字。因此,我们有充分的理由怀疑塞阔雅并没有「字母」的概念,他很可能没有意识到音节是由辅音和元音结合而成的。也是不凑巧,切罗基语的音系不像日语那么简单:不允许辅音群,元音无声调,不分长短;不然,倒也不一定成为表音功能如此弱的一种表音文字了。


注释:

[1] 严格说来,只有全音素文字、辅音音素文字和元音附标文字才能叫做「字母」,音节文字只能叫做音节文字(好像有点废话);但「音节文字表」这个名字很生硬,切罗基音节文字的「音节文字表」又没有「五十音」之类的专属名字,所以此处还是称其为「字母表」。

[2] 国际音标用 /ʰ/ 表示其前一个音送气。

[3] 为了尽量让不熟悉音标的人理解这些发音,我用汉语拼音里相同的发音与其对应。如果汉语拼音里没有相同的发音,再用英语。如果英语里也没有,再举其他语言的例子意义也不大了。

[4] 国际音标用五个符号来表示声调:/˩/、/˨/、/˧/、/˦/、/˥/,短横线的位置表示调值高低。同样地,我用普通话声调来帮助不熟悉音标的人理解这个概念:普通话的阴平(一声)用国际音标写为 /˥/(调值5),阳平(二声)用国际音标写为 /˧˥/(调值35),上声(三声)用国际音标写为 /˨˩˦/(214),去声(四声)用国际音标写为 /˥˩/(51)。声调符号写在对应元音之后。

[5] 切罗基音节文字还有一个很大的槽点,就是不能表现切罗基语的词缀和词干,只能表示完整的词语;所以切罗基语的词缀和词干都要用拉丁字母来写。但因为这已经涉及语法了,本文就不吐槽这一点了。另外,对于并不需要研究语法的母语者来说,这倒也不影响他们使用切罗基音节文字。

你可能感兴趣的:(切罗基音节文字及其表音策略)