1. 引言
对于异体字的定义,一直以来都处于争议之中。古人多以“或体”、“重文”、“别字”、“异文”、“俗体”等称呼表示异体字。即使是权威词典,关于异体字的定义也不一致。例如《辞海》(1979)以“音同义同而形体不同的字”对其进行定义。《现代汉语词典》(1996)则认为,“‘异体字’指与‘规定的’正体字同音同义而写法不同的字”[1] (p. 95)。考察学术界,发现对于异体字存在两种不同的定义,一是以王力先生、郭锡良先生为代表的,认为异体字音义完全相同。一是以裘锡圭先生、高更生先生等为代表的,他们认为异体字有两类:一类音义完全相同,一类音义部分相同[2] (p. 73)。
笔者在校对Unicode数据库中的异体字发现,真实的情况远远复杂得多。许多异体字之间并不是音义完全严格对应,更普遍的情况是音义部分对应,甚至还存在音异而义同形近的现象。因此,笔者认为关于异体字的定义或许应该采用裘锡圭先生的分类,或许更为严谨。
2. 异体字的音义匹配不对应
在校对古汉语异体字时,笔者发现大多数异体字都符合音义完全对应规律,如“㝅”、“𣫃”、“
”、“𰔕”等字,不论是考查字统网还是葉典,其音义完全对应,音皆读作“gou4”,释义为“哺乳”义。这些音义完全对应的异体字往往在形体上都十分近似,大多只是点、横、竖、折、捺等笔画的或有或无,例如“玄(𤣥、
、
)”、“丹(
、𠂁、⺝)”;或部件位置的变化,例如“匙(㔭)”、“鯬(𩼽)”、“峰(峯)”;或改换字形相近的部件,例如“貯(𡪄)”、“覓(
)”、“鵁”与“𩾾”等。古时“贝、牙、白、舟、丹、角、日、自、豆、甘、血、而、面”这些部件作偏旁使用时存在相互替代的情况。这通常是古人造字或书写时的不严谨随意改换造成的。
还有些音义完全对应的异体字之间字形差异较大,考察其组成部件,可分为两类。一类是选用音义相关的不同部件。由于汉字是表意文字,早期象形造字“随体诘诎”只要描摹物象即可。而会意字、指事字则是在象形字的基础上创制,形声字的形旁、声旁也是象形、会意字,故造字之时形与声的符号表示就有多种可能[3],如“手”、“扌”、“攵”皆表示与“手”有关的动作行为。“辶”和“足”都表示与“脚”或“行走”有关。又如以“彳”为形符的“征”、“徂”、“𢓊”、“𢓉”诸字可写成以“辵”为形符的“𨒌”、“䢐”、“𨑭”、“返”,因为“彳”是小步行走,而“辵”是从彳从止,为步履之义,与“彳”义近,故可更换形符而异构。“隹”与“鳥”在表示鸟类动物时经常互用,比如“𪇰”与“𩁠”、“鸅”与“𩁇”、“䨄”与“䳺”、“鷄”与“雞”等。这些都是选取义同或近的部件来表义。此外,还有选取音同或音近的部件相互替换,比如“掏”、“搯”,声符“匋”可以用同“舀”(yao3),皆表示“用瓢、勺等挹取东西”。又如“鶀”与“𪅾”,正体选取“其”(渠之切,群母之韵字)为声符,异体选取“欺”(去其切,溪母之韵字)为声符。都属于“见”组字,同音而相互替代。再如“驾”与“𤙑”,二字的形符分别选用了“牛、马”,都为牲畜。声符上,“驾”的声符“加”(古牙切)为“见母麻韵”字,“𤙑”的声符“各”(古落切)为“见母鐸韵”字,为双声关系,可相互替代。类似的还有“粒(𩚷)”、“萁(𧯯)”、“箏(𩗲)”(改换形符),“蜇(𧑱)”、“螽(𧑄)”、“蜸(䘆)”(改换声符)。这是由于古人造字较为随意,多选取相同、相近、相关的形符或声符部件替换,从而造成一大批因为“异构”而产生的异体字。另外一类是异体字之间选用的部件没有任何关系。如“掏”与“
”字形差异非常大,但是音义完全相同。又如“𨑏”与“䭀”二字音义完全相同,但是“𨑏”只与“䭀”右半边字形相似。针对这些字形差异巨大的,就必须回归原典结合具体语境才能确定其意义。这种音义完全相同的异体字我们称为“典型异体字”,它们对我们的语言是没有用的,应当选定通行字作正体,剔除其他异体字。
但是语言是复杂的,考察古汉语异体字数据库发现,有些互为异体关系的几个字之间音义并非完全对应,可分为几类。
第一类,音异的异体关系,即互为异体关系的几个字读音不同,但是意义相同。
“齹”–“𪘓”
“齹”ci1:牙齿参差不齐,与“𪘓”cuo2:牙齿参差不齐貌。
第二类,音义包含的异体关系,即甲字的音义包含乙的音义。
“轠”–“𨏒”
二字读作“lei2”时,共同包含四个义项:“1) 碰击;2) 车;3) 接连不断貌;4) 车轮碾压”,该读音下二字音义全同,为典型异体关系。但“𨏒”还可以读作“luo4”,义为“车转声”,该音义下二字不可以替代,当为两个字。
“欢”–“讙”
“欢–讙”:读音为“huan1”,二字同义,为“欢乐、喜爱”,但是“讙”还有“喧哗、责备”义,那么我们就不能简单用“欢”代替“讙”。
第三类,几个字之间音义相互交叉,即音义存在重叠部分。
“橪”–“㮒”–“禋”
“橪”:读作“ran3”时,包含两个义项:“1) 酸小;2) 染”;读作“yan1”时,“橪支”也作“撚支”,香草名(一说木名)。“㮒”读作“yan1”时,“㮒支”同“橪支”,此时二字构成异体关系;而“㮒”还可以读作“yin1”,此时“㮒”同“禋”:“祭名”。
“偷”–“媮”–“愉”
“偷–媮”:读作“tou1”,二字共同的义项是“苟且偷安”义,但是“媮”还有“巧黠、轻视”义,此外“媮”还读作yu2,表“靡、安乐”义,其“安乐”义与“愉”构成异体关系。
“翻”–“
”
“翻–
”:音“fan1”,二字共同义项是“翻译、翻阅”,此时“
”可被“翻”替代,而“
”还有“反复、声音杂乱”义,则不可被替代,应该保留。
类似的例子还有许多,在处理这些音义交叉的异体字时,对于交叉的音义可以选取更为常用的字代替另外的字,而其他各自的音义则应该予以保留,不可粗略删去,否则在阅读古籍时易造成理解困难与错误。
3. 异体字音义不匹配的原因
3.1. 字义发展演变
古代汉语是以单音节语素为主,随着时代的发展与表达的需要,现有的文字无法表达庞大复杂的世界,加以语言经济性原则的影响,所以出现一个字包含多个义项,即兼作几个字用,一个字负载过多的义项容易造成歧义,故古人为了区别不同的义项,通常采用改变字音或增添部件的方法,由此产生大量的新字。如“好”(hao3名词义,hao4动词义)、“食”(shi1动词,si4使动义)。但是汉字一字多义现象依旧十分普遍。有些字所负担的义项较多,但是其各义项却都可以找到更常用的字替代。如“佔”在古代有多个义项,现代汉语中各义项下都可以与他字形成异体关系,音“chan1”时,与“覘”形成异体关系;音“zhan4”时,同“占”或“站”。那么在整理这类各义项都可被其他字所替代时,应当分化其义项,舍弃该字。这些新字分化了本字的部分含义,在发展演变的过程中,彼此之间逐渐形成同源字,当作几个字。如“或”《说文解字·死部》:“𣣌,战见血曰伤,乱或为惛,死而复生为𣣌”。清段玉裁《说文解字注》:“乱或为惛。或、惑古今字”。《说文解字·心部》:“惑,乱也”。段玉裁注:“古多假或为惑”。“或”的本义为“邦国”,“疑惑”义无本字,故假借音同的“或”来记录,《孟子·告子上》:“无或乎王之不智也”。后才专门造“惑”字表示“疑惑”义。至此,“或”与“惑”分工明确,分化为两个字。这种情况下,不可以将当作异体字,分化之后就是两个不同的字。
3.2. 字音发展变化
具有异体关系的一组字之间各自出现的时间、地点不同,都会影响异体字的读音。从历时角度,存在古今音差异;从共时角度,存在方言异读。
语音是发展变化的,表示感叹的语气词“啊、哈、呜、咦”实际都属于同一个字,它们是由于元音高化而分化出不同的感叹词。结合大小徐为《说文》所注的反切,我们会发现,唐宋时期字音已经发生了系统性的变化,如“章”母和“莊”母混,“唇”:大徐注“側鄰”反,为“章”母,小徐注“止鄰”反,为“莊”母。“䟴”:大徐注“側鄰”反,为“章”韵,小徐注“止鄰”反,为“莊”母。此外,“巧”韵和“小”韵合流,“𩱦”大徐注“尺沼”反(昌小上開三效),小徐注“齒沼”反(昌小上開三效),而《廣韻》注“初爪”切,《集韵》注“楚絞”切,都为“巧”韵。可见语音是变化的,这也导致了一些异体字字音不同。又如“𨳆”(nang4)“发乱”义,叶典注同“鬤”(rang2),“𨳆”属“泥”母,而“鬤”属于“娘”母和“日”母,而结合钱大昕“娘日归泥”结论,我们可以说,“𨳆”、“鬤”二字字音在早期应相同。
例如,“㷄”(hui3)为“火”的异体字,《广韵》注音“呼罪切”,《玉篇》:“楚人呼火为㷄”,杨雄《方言》则使用“转语”来解释,“㷄,火也。楚转語也”。可见,不同的方言用字时可能还会按照自己方言音特点而改换声符,以求得与共同语的相似性,由此会产生一批义同音近形异的异体字。又如“甬”(yong1)与“傭”同,义为“受人雇用”,《方言》:“自关而東,魏宋楚之间,保庸谓之甬”。这一义项下异体关系的产生实际上也是受到方言的影响。
古书给汉字注音常用反切法,甚至取多音字为反切字用来注音的。这就涉及多音字常读音的问题。有多音的汉字在不同时代可能会有不同的常读音,后人在按照当时音拼读反切时,可能会出现用来注音的反切字字音变化而导致被切字读音改变。即使是处于同一时代的人,可能也会有自己偏向的多音字的常读音,从而导致拼读时字音不同。
3.3. 字形讹变
古代由于印刷技术落后,多靠手抄记录古代典籍。这通常会产生许多因传抄错误而产生的错字,或因为形或声相似而被人误混为一字,张冠李戴,当这些错字不为人所纠正而大量使用时,积非成是,错讹字便与本字形成了异体关系,这就是语言学中的从俗从众原则。如“扺–抵”。“扺(zhi3)”:“侧击”义。段注:“按扺字今多讹作抵,其音义皆殊”。“抵(di3)”:“排挤、抵赖”义,二者音义皆异,仅因为形近而误。今讹误字“抵(zhi3)”跟古“扺(zhi3)”字是异体字关系。高亨先生说:“文字既多,人不能全数识别,亦不能全数记忆,当其人撰文之时,某事物虽有本字,其人或竟不知,或知之而偶忘,自不免借用音近之字以当之。况古代经传,多由先生口授弟子,弟子耳闻之,手书之,依其音,仓卒之间,往往不能求其字之必正,但求其音之无误而已”。如“姟”(gai1),义为“古代最大数目名”。但是在古籍中,《法苑珠林》卷六十“杂咒部”:“此十五鬼神常游行世间,为婴姟小儿而作于恐怖”。《入唐求法巡礼行记》卷三:“于乞丐中,有一孕女怀妊,在座备受自分饭食讫,更索胎中姟子之分”等。这些例中的“姟”字应为“孩”的俗字,“子”、“女”义相近,如“娩”字又可从“孑”,“婴”字可赘加“孑”旁,也可赘加“女”旁,适其比类。所以“姟”音hai2时,与“孩”具有了异体关系。又如“謟”(tao1)其义指“1) 可疑;2) 超越本分;3) 隐瞒”,本身就具备音义。但由于字形与“谄媚”之“諂”相近,故被错讹为“諂”,产生了异体关系。这种书写讹误、积非成是而导致原本音义皆殊的两个不同的字在某些时刻表现出异体关系,在实际处理时,应找出其本字,改正讹误。
此外,有些字形可能会受到与之组合搭配的字形的影响,受到类推作用,可能通过增添偏旁部首而类化为与之类似的字形,由此产生异体关系。如“𱢚”与“闪”,“𱢚”字形是受到“𱢚晱”中的“晱”影响,类化所致。
此外,还有造字形体偶合而产生异形字。人们造字时,所造的字可能恰巧与已有的一个字形体重合了。这类字往往只是形同而音义皆无关,当为两个字,我们称之为“异形字”,所谓异形字,即字形相同但音义无关(也有读音相近的)的几个字之间的关系,这类异形字尤其常见于俗字。分析时,应找出其所表示的本字,后更正过来,不应把形同的二字看成异体关系。
3.4. 人为干预
甲乙二字在古代分属于两个不同的字,而在汉字书写过程中则存在用甲字代替乙字以求书写简便情况,值得注意的是,汉字简化后所采取的一些简化字形在古代就有,且与简化前的原字意义无联系,只是人为选用笔画较少形体接近或有关联的字,让其负担原字的音义。如“瀞(jing4)”《说文解字·水部》:“瀞,无垢薉也”。“净(cheng2)”:“春秋鲁国都城北城门的护城河名”,二字音义皆异。为求书写简便,便借“净”表示“洁净”之“瀞”,后代假借之法通行,在“洁净”义项上,二字便构成异体关系。又“划–劃”二字:“划(hua2)”,义为“用桨一类的东西拨水使船前进”。“劃”:读作“hua2”时,义为“用尖利物把东西割开”;读“hua4”时,则义为“划分、计划”。“划–劃”二字音义皆异,现代汉语把“劃”简化为“划”,其音义皆归为“划”,造成“劃–划”二字形成异体关系。类似的例子还有很多,许多简化字形由于书写便利,被用来取代字形复杂的属于两个字的他字,又如“癢”(yang3),义为“瘙痒”,而“痒”(yang2),原指“忧思成病”,现代汉语中选用笔画简单的“痒”来表示“癢”。同样的还有“袜”原本音“mo4”,义为“抹胸、肚兜”,现代汉语中被用来简化“襪”,其意义也被“襪”所替代。“苧”(zhu4)表“苧麻”,替代“薴”(ning2)表“草乱”义。“㑟”(beng3)表示“虚伪狡诈的人”,后用作“儐”(bin1),义为“接引宾客”。这类简化在我们阅读古籍时尤其需要注意,弄清简化字形并不等于现代汉语的简化字,二者在古代是不同的两个字,只是现代经过汉字简化改革而具有了异体关系。
汉字简化方案把许多书写复杂的汉字或选用古代互为异体关系中形体简单的字形代替,或选用音义无关的他字来记录。对后一种情况,我们尤其需要注意,因为人为干预而使得古代原本不同的两个字在现代汉语中发展为异体字关系,在阅读古籍时仍须用未简化的本字来解读。
古代在书写汉字时,有时为了避讳或求雅,或用字随意,会另造或选取同音字代替。例如“屎–矢”,“屎”在甲骨文中就有,象人拉屎之形,古人觉其不雅,便用同音的“矢”代替,如《狱中杂记》“矢溺皆闭其中,与饮食之气相薄”。《史记·廉颇蔺相如列传》:“廉将军虽老,尚善饭,然与臣坐顷之,三遗矢矣”。这实际上是因为同音而借甲字来表示乙字的假借现象,“矢”是“屎”的假借字,不属于异体关系。唐以后,“屎”已经大量使用了。又假“荏”代替“栠”,《小雅》、大雅皆言荏染柔木。毛曰:“荏染,柔意也”。论语:“色厲而內荏”。孔曰:“荏,柔也。按,此荏皆当作栠。經典多假荏而栠废矣”。在校对异体字时应注意这类通假现象,其并非是异体关系。
4. 整理原则
4.1. 代替法
对于音义完全匹配的异体字,其使用功能相同,在任何情况下都可以互相替代。它们的存在与使用会对我们语言造成混乱,应当废除。这类字我们便可以依据从俗从众或者语言经济学原则,选取其中大众接受度高或者书写简便的字为其正体字,而废除其他的字。例如,现代汉语中选取笔画较少的“岩”代替“巖”,二字音义全同,只需遵循书写方便经济原则或从俗从众的原则即可。同样地,以“裙”代替“帬”,以“灾”代替“災”等皆是如此。
4.2. 取舍法
甲字义项包含乙字义项,我们将其称之为“包孕式异体字”,可分为同音包孕异体字与多音包孕异体字。同音包孕异体字,即甲乙二字读音相同,且甲字义项包括乙字的义项。那么我们便可选用甲字而舍弃乙字,以求语言经济性。例如“摔”(shuai1)“跌倒”义项,古以“𨄮”分化,后舍弃“𨄮”,用“摔”表示。又如“陻”与“堙”,“陻”(yin1)义为“堵塞”与“堙1”互为异体关系,由于语言的经济性,人们就淘汰“陻”,而以“堙”为正体。又如“躢”(ta4)与“踏2”互为异体关系。
4.3. 分化法
包孕式异体字中还有另外一类,即多音包孕式异体字,表示甲字有几个读音,乙字跟甲字其中一个或几个读音的意义相同的异体字[4],多音字其中一个音义被一个规范字所替代,另外的音义应当保留加以注释或让另外的规范字替代,否则会造成古书阅读困难与错误。此时我们应该采取分化法,将不同的音义进行分析处理。如“耑”:音“duan1”时,与“端”同;音“zhuan1”时与“专”同,其不同的音义皆可被其他规范字所替代,故其本字应废除。又如“氾”:音“fan4”时,与“泛”同,此时二字是异体关系,用“泛”代替“氾”。但是“氾”音“fan2”时,义为古地名与姓氏,应当保留。又如“洊”有三个音义:1) “jian4”:“水至”,同“瀳”;2) “jian4”:“再;重”,同“荐”;3) “cun2”,古县名“洊䣕”同“𨚲䣕”。“洊”三个音义在现代汉语中都有更常见的字代替,与他字形成包孕式异体关系。还有些包孕异体字在后期并没有简单地归于一字,为了避免同一字形承担过多义项而导致的语义歧义与不清,在处理这类字时可能会用两个或多个字来分化义项。如“擷”(xie2)有两个义项,第一个义项为“把衣襟插在腰带上兜东西”;第二个义项为“摘取”。“襭”(xie2)与“擷”第一个义项相同,二字在此义项下属于异体关系,按照经济性原则应将“襭”淘汰,但是为了表义准确,分别用“擷”、“襭”,借助偏旁分化义项。
4.4. 综合法
甲乙二字仅部分音义对应的,即甲1义项与乙2义项相匹配,但是甲乙两字还有各自其他的音义,那么在共同音义上要考虑其产生原因,若为异体可以选取更常见的字来代替,若为假借则应该找出本字。而对于不同的音义则应视常用与否选择保留或记录。如“覈–核”在“核验、果核”(皆读“he2”)义项上对应,此时我们选取更为简单常见的“核”来表示,但是“覈”还有“翔实、深刻、粗屑”义,是“核”所不具备的,故我们不可以完全以“核”代替“覈”,应当将二字都保留。与之类似的还有“洩–泄”二字音义大致对应,但是“洩洩”(舒畅、和乐貌)则并不等于“泄泄”(多言),应对“洩洩”保留并注释。又如“𠯍”ran2是“呥”的异体字,但是“𠯍𠯍”表示“安然自得貌”,而“呥”则无此义,故“𠯍𠯍”应当保留。
5. 结语
异体字是汉字上一种特殊且重要的语言现象,其产生原因十分复杂,既包括汉字本身形音义三方面的演变,也会受到人为因素的干扰。关于异体字,并没有一个明确的定论,那部分音义不完全对应的异体关系,需要我们重视。在整理异体字时,尤其需要依据其之前的音义对应关系,具体问题具体分析。对于音义不完全匹配的异体字,若甲字义项包含乙字义项,我们可以采用取舍法,淘汰其中含义比较少(乙字)的字。若甲乙二字仅个别音义重合,我们可以采用分化法,使甲字和乙字进行具体分工,在重合音义项上选取更为常用的字代替,同时保留甲乙二字不同的音义项。
同时由于异体字的现实情况十分复杂,关于异体字的概念还须进一步明确。接着才是对其进行深入分析,由于数据磅礴繁杂,对于古书理解较为困难,这就使得实际在处理异体字时,许多情况都需要回归原典,理解文意,方可判断修改。本文所提出的有关异体字的相关整理原则是在整理Unicode数据库时总结归纳得出的,但依旧存在需要完善的地方。