最早的语言是什么语言
原文作者|[澳门]彼得贝尔伍德
粋振回|羅東
《最早的农人:农业社会的起源》,[澳门]彼得贝尔伍德着,陈洪波等译,上海古籍出版社,2020年10月。
语言产生及其网络:“语言区”或“语言树”
语言学家、对比较历史语言学感兴趣的历史学家、考古学家和人类学家倾向于认为语系历史有两种类型。 一个是从母语到子语言的系统发展过程,另一个是合作进化模型,强调相邻语言之间的相互作用。
语言学家鲍勃迪克森认为,语言系统的存在是语言的短期间断扩张造成的。
语言系统表现出共同的地域语言特征,这是长期以来不断交流和借用过程的结果。
正如他所说:“所有语言都可能与其他语言有两个相似之处。 第一个是基因的相似性,它们来自同一个原始语言。 二是地域相似性,这是因为各种语言在地理上相邻,相互借用”。
第三种可能性是偶然发生的相似,但这对我们的讨论并不重要。
映画《疯狂原始人》画面。
在印欧语和南岛语这样的大语系中,这两个过程产生的结果很明显。
几千公里外的语言,有着明显的人种亲戚关系。
例如英语和孟加拉语、马来语和大溪地语、纳瓦霍语和加拿大阿萨巴苏鲁语。
另一方面,在一些特定地区,不同的语系表现出共同的地域特征。
语言学家经常讨论的这种“语言区”包括印度次大陆、中美洲、巴尔干半岛和亚马逊盆地。
但是,有必要强调的是,——这一地区内的语言尽管有相互作用,但仍维持着它们自身的物种关系。
例如,在印度次大陆,没有发现有印欧语、德拉维达语、藏语、南亚语不能混合分类的语言。
另一个充分开展研究的地方是亚马逊的沃佩斯地区,一些群体实行跨语言婚姻制。 然而,尽管当地语系结构统一,存在普遍的多语言现象,阿拉伯语和图卡诺语这样的语系在人种系统中仍保持着内在的一致性。
亚马逊流域。
图为《亚马逊萌猴奇遇记》起。
另一个重要的基本概念是新语系的最初形成。
根据迪克森的看法,新语系的形成相当快。
由于内部和外部两个原因,语言总是不断变化。
把盎格鲁-撒克逊英语、乔叟英语甚至比作E.M .福斯特英语,把现代罗曼语诸语言与其共同祖先拉丁语进行比较,就明显地证明了这一点。
基于这个理由,我们可以推测,广泛分布的语言,例如印欧语系和南岛语系,在距今很近的年代就应该达到了现在的地理范围,它们在现在所有语言的分支中都有共同的来源。
一些语言学家估计,语言可追踪的时间上限为距今7000年至10000年,更早,文化常用基本词汇表中共有同源词的比例不会超过5%—10%。
因此,如果说早期印欧语系的人花了一万多年才传播到远离发源地的冰岛和孟加拉,那么印欧语系的存在状态就不可能像今天这样被语言学家清晰地识别出来。
上述表达似乎有点难懂,但它确实表明今天属于农业民族的诸语言系确实是全新世而不是更新世发生的现象,它们的历史完全在以农业方式从事食物生产的时间范围内。
语系识别与种系关系
梵高作品《第一步》。
画面是农村的耕地,背面是农民的家。
南岛语系包括大约1,000多种语言,横跨半个地球分布,从马达加斯加到复活节岛。
南岛语的使用者约有3亿5千万人,大部分在东南亚,特别是印度尼西亚和菲律宾。
南岛语族中,每个语言的使用者数量都不一样,从数百人到超过6000万人。
南岛语民族大多是亚洲人种,但西太平洋的美拉尼西亚人大多也像菲律宾的尼格利塔人一样说南岛语。
在西方殖民时期以前,这里的地域文化发展大不相同,从印度教和伊斯兰国家到森林狩猎采集游群有各种各样的形态。
然而,南岛语族各实体的这种时空分布状态并不是没有理由的。
南岛语族分布非常广泛,其他民族尤其是西美拉尼西亚人虽然是后来掌握的南岛语,但在语言和文化上有共同的中心地区,所有的语言都是发散的。
让我们来看看相关的概念。
语系是指一组语言,具有相同的语言特征,主要保留在语言发展的初期。
一些重要特征确实来自语言肇始时期的发明,但当然如果没有其他外部语言作为佐证,这还无法确认。
语族或语族由亲密的语言分支构成,语言分支的共同特征是有创新,类似于生物分类学上的派生或自形特征。
同源词的识别是复杂而困难的,不可否认,理论上会影响历史解释的准确性。
例如,当一个词支中的所有语言分化后不久就被借用时,借用词通常模仿同源词。
但是,在这种情况下,这些初期借用词和真正的同源词一样,产生于相似的地理环境中,所以内在意义相近。
另外,来自祖先语言的保留词保存在一个词枝而不是周边的词枝上时,经常被误认为是革新词,传播到远方的真正的同源词不会被忽略记录下来。
在这些情况下,语言研究的样本密度显然非常重要。
人们必须搞清楚,其他语言是真的没有这些词,还是没有被记录下来。
语系树建构起来之后,从中可以发现语言的某些特征。
所有语言都有一个可重建的祖型——原始语言,表现出一套可复原的特征。
对于试图重建古代文化的史前学家来说,最重要的特征词汇是传达了最原始含义的古代事物。
如果复原出的事物词汇其现代含义宽泛而且与其他词汇含义交叠,那么价值就比较有限,但一般来说,这类原始词汇是非常有用的文化信息来源。
例如,原始语言的重建证实,下文讨论的很多重要语系确实植根于农业人群而非狩猎采集者。
语言分析有时也能揭示出一种特定的文化特征是来自原始语言最初出现的时候,还是后来才引入的。
因此,西太平洋地区许多与农业、航海、渔业和制陶有关的物质文化看起来可以连续不断地回溯到原始海洋语阶段,即太平洋地区所有南岛语言的最初发展阶段,大约距今3500年。
类似的情况,根据白乐思的说法,密克罗尼西亚马里亚纳群岛查莫罗语里的大量词汇,是在大约距今4000年前直接来自原始马来波利尼西亚语,而不是更晚时候通过借用来到这些岛屿的。
狩猎的“原始人”。
然而,人们一定会问,如何确定所重建原始语言的地理范围?它只在某个村子使用,还是在一个大的方言区广泛流行?很久以前,
戈登柴尔德曾经评论原始印欧语:“雅利安语起源的摇篮在地理上必定是一个统一的整体;单是语言资料就体现出存在一组方言体系,在特定区域或大致相同的统一地理环境中构成了一个语言连续体。
”莱曼的观点与之类似:“很显然存在一个社群,不管其规模大小和内部一致性如何,它们在一段时间内都说着后来名之为原始印欧语的相对统一的语言,而且这个社群还具有自己独特的文化。
”但这并不意味着语言一定发源于某一个单一族群,比如说来自一处村落。
正如迪克森所指出的那样,一个特定语系“可能并非来自单一语言,而是来自某个小区域内一组结构和形式类似的不同语言”。
但是,一个原始语言不能在多个不相关的语言方向上走得太远,否则会破坏其内涵的统一性。
另一个方面,不同语系树可能有强弱之分,或者语系树在其不同发展阶段有强有弱。
强语系树的形状就像真正的树那样,具有明显的根和发散出的枝。
举一个例子,波利尼西亚语在其早期分化过程中形成了完整的树状结构,其中包括一种现在研究很透彻的原始语言——原波利尼西亚语。
根据安德鲁帕利的研究,该语言有大量创新内容,包括多达1392个事物名词、14项形态特征和8项语法特征。
所有这些都是在一个边界清晰且统一的起源地创造出来的,地理位置在大约公元前1000年到公元500年的西波利尼西亚,特别是汤加和萨摩亚群岛。
这意味着存在一段漫长的发展停滞期,就相关考古材料来看,停滞了1000多年,在此期间,本地区人群之间保持交流联系,共同经历了大量而广泛的语言变化,但这些变化从未传播到周边其他地区,如斐济或瓦努阿图。
大麦地岩画的史前岩画。
一般来说,语系的发源地,就像古生物学那样,最可能的地方是语支最早分离的地方,或者说语系树开始分叉的地方。
但是,请记住,要想确定这一点,我们必须要有一个强语系树。
如果是一个呈“耙形”结构的弱语系树,那就不太可能确定语言的准确起源地。
幸运的是,许多语系都同时包含了耙形和树状两种分支结构。
例如,印欧语系的大多数语支是耙形结构,但是古代安纳托利亚语有足够的特征说明印欧语系可能起源于土耳其的某个地方。
同样,马来波利尼西亚语支也是耙形结构,但是,在南岛语系里,台湾土著语不属于马来波利尼西亚语支,而是形成了几个第一层语支,非常有力地证明了台湾岛是南岛语言的发源地。
另一点需要注意的是,语系并不总是起源于当前分布范围的中心。
中心区域起源的推断显然不适用于类似南岛语和贝努埃刚果语这样的语系,这些语系早期基本上是从发源地单向向外传播的。
语言和语系是怎样传播的?
语言学家一般假设,一个真实存在的语系,一个可以通过对共享创新的比较研究得以证明的语系,其内部结构系由遗传构建而成,包括人群扩张过程中形成的多层次的可复原的原始语言。
从比较的角度来看,这是唯一有意义的解释。
历史资料表明,如果语言单独传播,没有伴随本语种人群的迁徙或者扩散,那么永远不可能产生我们所讨论的这种跨大洲级别的基因相似的语言群。
人们只需要考察一下过去许多大帝国的多种多样的语言历史——亚述、阿契曼尼德、希腊、罗马、蒙古、阿兹特克,甚至西班牙和英国——就会意识到这一点。
如果征服者没有进行大规模永久性移民,单靠帝国征服本身,那么长期来看,当地很少会去使用外来语。
以大航海时代为背景的电影《哥伦布传1492》 剧照。
贸易在大规模语言传播过程中的作用也不大。
在注重贸易的巴布亚新几内亚,语言的多样性在民族志时代达到了创纪录的水平,现在这里普遍使用巴布亚皮钦语和英语,在很大程度上这是现代力量如国家、文化、电视和族外婚等造成的社会巨变的结果。
然而,即使存在所有这些诱因,巴布亚皮钦语的统治地位仍然只是整个太平洋范围内的一个局部现象,而且规模和遥远的史前时期相比完全不可同日而语。
由此可见,征服、贸易和文化扩散可以传播语言,但除非得到另一个因素——语言使用者自身移民活动的支持,单靠传播永远不会达到跨洲大语系的规模。
这里我不再过多引用其他历史文献,重点以公元7世纪阿拉伯人征服世界为例,来证明上文所说语言传播必须有其使用者参与方能成功的观点。
我们首先看一下阿拉伯语本身的传播情况。
在约旦和叙利亚的部分地区,早在7世纪前已经有大量阿拉伯语人群从阿拉伯半岛北迁至此,所以穆斯林征服这里的时候并未发生多少语言取代。
将阿拉伯语引入伊拉克和埃及则需要进行征服活动,途径是通过驻防此地的阿拉伯士兵及其家庭传播开来。
因此,此地阿拉伯语的出现毫无疑问是通过移民和士兵之口开始的,不管后来此地有多少人学会了这种语言。
然而,阿拉伯的征服行动并没有延伸到南亚或东南亚,甚至没有直接进入伊朗和巴基斯坦。
结果,今天世界上绝大多数的穆斯林不会说除《古兰经》 之外的阿拉伯语。
在念诵《古兰经》 时,他们实际上使用的也是7世纪的阿拉伯语而不是现代阿拉伯语。
正如曼斯菲尔德所说:“尽管阿拉伯语言和文化在伊斯兰世界中占有特殊和优越的地位,但只有约五分之一或六分之一的穆斯林说阿拉伯语。
”这给了我们一个典型的反面例证——没有人口迁徙就没有语言传播,和宗教状况没有什么关系。
伊斯兰教在印度尼西亚的传播重复了一个1000多年前曾经发生的故事。
一千多年前,来自印度的印度教和佛教也在这里传播过,但同样也没有大量人口迁入东南亚,除了少数商人和宗教人士。
尽管印度的宗教和王权制度对印尼有着深刻的社会文化影响,马来语和爪哇语借用了数百个梵语、帕拉克里语和泰米尔语词汇,然而,印尼人从来没有转而使用印度语。
除了偶尔学习一下之外,印度尼西亚语和印度语甚至没有因为相互联系而产生任何明显的形态上的相似性。
正如科林马西卡所指出的那样,仅靠宗教和政治的力量并不足以促进语言融合,而是需要人群之间“打破结构地亲密交往”。
所有这一切说明,阿拉伯语基本上只在中东和北非被征服地区的阿拉伯移民者口中传播,而且在早期,似乎其他非阿拉伯人很少转向使用该语言。
毫无疑问,整个过程是由阿拉伯语与《古兰经》 的联系所推动的,但这显然不是阿拉伯语传播的重要驱动因素。
当然,在后来的几个世纪里,许多非阿拉伯血统的中东人和北非人肯定采用了阿拉伯语,但这有点离题,我们这里关注的是最初的传播及其因果关系,这显然不是语言转换带来的传播,而是母语使用者迁徙造成的。
电影《疯狂原始人》 画面。
相反,由于人口源源不断地从英国大量迁徙到美洲和澳大利亚,英语也因此传播到了这两个地区。
然而在被英国人征服和控制的另外一些地区,比如南亚、非洲大部和马来西亚,密集的土著人口外加热带疾病使得殖民进程陷于困境,阿尔弗雷德克罗斯比曾经对此做过精辟的描述。
如今,非洲、印度和马来西亚的英语主要是精英阶层在使用,并没有显示出取代印度语、泰米尔语或马来语等主流语言的迹象。
根据布雷顿的调查数据,1981年的人口普查显示,印度尽管有1100万人将英语作为第二语言,但母语为英语的人只有20.2万,大部分是英裔印度人。
而今天在印度尼西亚,荷兰语基本上已经灭绝,原因在于尽管荷兰在这一地区殖民统治了300年,但其间没有发生任何较大规模的从荷兰到印尼的人口迁徙。
基本上,最核心的一点就是观察到,如果用比较方法识别出某语言是具有来自共同祖先语言历史的一个遗传单元,那么该语言必定是通过母语使用者的迁徙传播来的,而不可能仅仅通过语言转换来传播。
考虑到这里所研究的语言关系万年以内的证据已经很难明确找到,以上观察对于从整体上认识现代人类的历史至关重要。
既然世界上大部分地区和人群都可以划入少数几个大语系,那么现代人类的史前史很可能就是由大规模的洲际人群迁徙造成的。
但是,我认为最重要的一个前提是,不应该假定说母语的迁徙人群全部来自语系最初产生地区的土著居民。
很多情况下,人群的生物特征和其语言并不完全对应,这种情况需要进一步解释。
举例来说,西欧和南亚的人种有着明显的生物学差异,但他们的语言同属一个语系。
在生物学特征上,美拉尼西亚人和说南岛语的菲律宾人更为接近,但他们的语言完全不是同一个语系。
语言转变和接触导致的语言变化在今天显而易见,在人类整个历史上也同样如此。