1. 引言
“语法化”这一概念最早由法国语言学家Meillet提出,所谓“语法化”指的是语言中意义实在的词转化为无实在意义、表语法功能成分的过程。究其根源,元代的周伯琦在《六书正伪》中已经提出了相似的概念:“大抵古人制字,皆从事物上起。今之虚字,皆古之实字”。更具体地说,“虚化”侧重于指词义由实到虚;而“语法化”则在于语法范畴与语法成分的产生与形成。因此,“语法化”的范畴相对“虚化”而言更广一些(沈家煊,1994) [1]。
“他”作为使用频率高的人称代词,历史中经过一系列语法化过程。而“她”作为新造专指女性的人称代词,在创立之初便引发争议,近年再度引发讨论。
本文旨在通过考察“他”的语法化进程,以期达到这一人称代词前后历史演变的脉络,以及在近代“他”划归男性专属之后,探究“她”这一专指女性的人称代词的构形逻辑,搜集数据验证“他们”的概括和使用情况,来探知背后女性视角的缺位。
2. “他”的语法化进程
汉字发展过程中,“他”字的演变从“其他”义到第三人称代词的“定指”义,再到近代汉语时期向“语气助词”的虚化以及现代汉语中的“话语标记”用法,其语法化过程均有迹可循。
“他”在上古文献中已经出现,但并非一开始就以第三人称的身份出现和使用。对此,吕叔湘(1985)认为“有定”和“无定”是判断“他”是否为第三人称代词的重要依据,并由此展开了关于“他”演变为第三人称代词过程的探讨[2]。关于“他”从“无定代词”演变为“第三人称代词”的过程,学者们有不同的看法。王力(1980)认为,第三人称代词“他”起源于唐代,宋代以后普遍地应用,这是有一定说服力的[3]。郭锡良(1980)则着眼于汉语第三人称代词系统,详细探讨了“他”的产生与发展过程,认为“他”在六朝发生了重大变化,唐代正式确立了第三人称代词的地位[4]。吴福祥(1996)认为“文献中,‘他’作第三人称代词可靠的例子始见于唐初”[5]。松江崇(2024)以战国至唐五代为语料,考察了“他”在早期汉语中的指称功能变化[6]。尽管在描述上存在细微差异,但以上学者均认为第三人称代词“他”起源于唐代。
前面我们提到“他”字经历了由“指示代词”演变为“第三人称代词”的过程,这其中伴随着“他”由“泛指众人”到“定指一人”、由“无定”到“有定”的转变(吕叔湘著,江蓝生补,1985)。郭锡良(1980)从各个阶段的语料统计入手,对此进行了详尽的考察。由于此前学者们所做的工作,我们对“他”字演变过程的理解也变得相对容易。由此,本文将其分为以下四个阶段:
(一) 作“其它”讲,充当名词或放在名词前面。
1) 王顾左右而言他。——《孟子·梁惠王下》
2) 又何敢有他志以辱君义?——《晋语二》
3) 他日我如此,必尝异味。——《左传》
4) 门将并守他门。——《墨子》
这一阶段“他”主要泛指“其它的”或“其它”,并未产生人称代词用法。
(二) 魏晋以后,作“他人”的例子增多,常与“自”“己”“我”对举使用。
5) 努力各自为身屈,不能为他人也。——《太平经》
6) 自负其身耳,不负他人也,复知之乎?——《太平经》
7) 帝喾能自言其名,然不能言他人之名。——《王充论衡》
此阶段,“他”和“人”的组合增多,和说话者产生连结,由泛指到表示自身对立面。
(三) 代指语境中已出现的对象,专指一个或某几个人,“任何义”消失。
8) 故他欲入朝而不果。王太后置酒。请使者及嘉等。——《前汉纪·荀悦》
9) 颜渊,他姓也。子死且不礼,况其礼他姓之人乎?——《王充论衡》
10) 妾有二子而出嫁,君命他妾兼子为其母,所命妾今亡,子当有服不?——《全刘宋文》
这一种情况即说话人和听话人心中都明白“他”所指的对象,但在语言层面“他”的有定性有待进一步明确,仍表示自身的对立面,但“他”还不是真正的“第三人称代词”,但已经很接近,这也和田恩慧(2023)所提出的观点相似[7]。
(四) 真正意义上的第三人称代词“他”产生于唐朝。
11) 众奴皆惭,问他所欲,他曰:“欲得卿曹拜耳。”——《三国志(裴松之注)》
12) 則女子可冒絳紗,使他丈夫發而相見,拜以為婿,輒可委去。——《通典》
至此,“他”完成了从“指示代词”到“第三人称代词”的转变,并且随着佛语录的传播,使用功能愈发完善,逐渐成为了“人称代词”体系中不可或缺的一部分,但作“其它”意仍普遍存在。
经过上古时期泛指环境,到说话者的对立面,对立面进一步缩小和固定,“任何义”消失,最终形成第三人称代词,并且在唐代之后广泛使用。此处必须强调,即使形成了确定义的第三人称,“他”在宋元明清时期并未产生分化,如:
13) 众里寻他千百度,慕然回首,那人却在,灯火阑珊处。——辛弃疾《青玉案》
14) 他道我屈死也。——关汉卿《窦娥冤》
15) 西门庆见他出来,便与他说话。——《金瓶梅》
16) 甚荒唐,到头来都是为他人作嫁衣裳。——曹雪芹《红楼梦》
在《青玉案》里,辛弃疾以“他”指自己心仪的女子;《窦娥冤》《金瓶梅》的语境中“他”均指称女子,《红楼梦》中,作者也以“他”指“嫁衣裳”的主人,并在写林黛玉、薛宝钗等女性角色时大量使用“他”。
故宋元明清时代,“他”在功能层面已经确立为第三人称代词,并未发生性别分化,男女一律用“他”,性别区分只依赖语境而非代词形式。
3. 新造字“她”的产生过程及背后逻辑
现代汉语体系中,关于人称代词有着严格的三分系统,男性用“他”代指,女性用“她”代指,称人以外的事物则用“它”代指。沿用至明清,在大量文学语料如《水浒传》《西游记》《红楼梦》中,“他”均可指代女性人物,为何在现代汉语中划归男性,形成了代词的三分局面?
《康熙字典》中指明,南朝梁代《玉篇》中曾经出现过“她”的符号,“古文姐字”,即古时“她”是“姐”的异体,或是“毑”的异体,“蜀谓母曰姐”,此处“姐”作“母亲”的称谓字,作为名词存在,而非代词。其与现代人称代词的“她”只是字形相同,并同指代阴性,语音、语义和词性均不相同。研究发现,音形义统一的女性人称代词“她”在上个世纪才被创造。
黄兴涛的《她字的文化史》中提出,刘半农最早提议为了翻译语言的对等,创造一个如同英语单词she的汉语词汇“她”[8]。周作人在《新青年》中公开提出并展开讨论,认同刘半农的新造字“她”,但仿照日本新造的女性人称代词“彼女”,为印刷之便创造一个“他女”代指女性,并率先使用,如他翻译的《卖火柴的小女孩》《可爱的人》等均使用“他女”。叶绍钧追随周作人,在《女子人格问题》中提出,为女子争取和男子独立平等应使用“他女”,“不承认他女是和己同等的人,因此也就不承认他女的人格。”在此篇文章中,叶绍钧代称改为“他女”和“他男”,拒绝另造新字“她”来标榜女性的特殊性。但由于语言的经济性,此类修改因繁复而未得到推广。
除此之外,关于“她”的争论还涉及诸多方面,以“伊”的代替使用最为强势,如钱玄同、鲁迅、周作人、朱自清、叶绍钧、李大钊、黎锦熙、陈望道等在1919至1922年间自觉使用“伊”。并且《妇女共鸣》杂志第3卷第5期为此发表启事:“本刊同人,以人字旁代男子、女字旁代女子、牛旁代物件,含有侮辱女子非人之意,所以拒用‘她’字,以‘伊’代之。”[9],并重新登载《本刊拒用‘她’字启事》再度声明。史文静(2023)研究了“伊”的发展流变,指出“伊”的意义和语法功能随汉语史分期不同发生演变,而五四运动后指称功能虽存在,但更多作为构词语素[10]。
现代关于“她”的讨论依然存在,将“女”从“亻”中单独列出成为了争论之一,由此本文考察了人称代词的相关解释。
(一) 也
《说文解字》中对于“也”的解释为“女陰也。象形。”[11]见图1。
即“也”创立之初便和女性相关。《说文解字注》中提到“也,女侌也,此篆女陰是本义。”[12]
(二) “他”和“佗”
“他”在《说文解字》中并无注解,但搜集语料整理发现,“他”最初有“其它”的含义。即文章整理的语法化第一阶段:“他”作“其它”讲,充当名词或放在名词前面。同时文章发现,春秋战国时期,已有表“其它”的词语出现,即“佗”。
Figure 1. Yě (也)
图1. 也
17) 制,岩邑也,虢叔死焉,佗邑唯命。——《左传·隐公元年》
18) 此无佗故也。——《大戴礼·礼察》
19) 佗日指动,必食异物。——《史记·郑世家》
例1中“佗邑唯命”指“其它的城池听从您调遣”,例2中“佗故”指“其它原因”,例3中的“佗日”和古汉语中的“他日”语义相同。即上古时期表示“其它义”时,“他”和“佗”同时存在。
《说文解字》中指出“佗”从人,“它”省声,本意是负担、负荷。《说文解字注》中指出,隶变“佗”爲“他”,用为彼之称。由此得知,“佗”的出现较“他”更早。
(三) 它
“它”的存在历史悠久,始于甲骨文时期,见图2。
Figure 2. Tā (它)
图2. 它
《说文解字》中解释为“虫也。从虫而长,象冤曲垂尾形。上古艸居患它,故相问无它乎。凡它之属皆从它。”即《说文解字》中表示“它”的本义是“蛇”。因字义细化,“它”加“虫”变声shé以示区别。“上古艸居患它,故相问无它乎。”因为蛇是人以外的事物,所以“它”也引申泛指其他事物,异体字为“牠”。蔡莹(2024)从同源词分化的角度确认“它”本义为“蛇”,虽未直接讨论“牠”,但也未理解“它”的语义演变提供了理论框架[13]。
需要注意的是,在人称代词三分的局面中,“它”泛指其它事物也经历了长时间的斗争,陈望道、钱玄同、陈斯白等人都给出了第三人称序列的不同方案,其中陈斯白基于前两者研究总结的序列,见图3。
Figure 3. Chen Sibai advocates for a system of third-person pronouns
图3. 陈斯白主张第三人称代词表
而陈望道也以图标系统阐述第三人称代词序列,主张单数分男性(他),女性(伊),中性(他),复数(他们) [14]。
以上方案都秉持着语言分类细密精确的原则,在当时同样引发争论,最终走向了“它”的统一。需要注意的是,在港澳台等地区仍旧使用“牠”以表示其它事物,见图4。
Figure 4. Tā (牠), a variant Chinese character for “Tā (它)”
图4. 牠,“它”的异体字
“牠”作为“它”的异体字,在语料中能找到诸多语例,和“她”不同,如:
20) 儀乃窮奢,牠無足論。《续道藏》
21) 那骡子见那铃铛满地乱滚,又一眼岔,牠便一踅头,顺着黑风岗的山根儿跑了下去。《儿女英雄传》
22) 还有一次太宗得到了一只上好的鹞鹰,把牠放在自己的肩膀上,很是得意。《魏郑公谏录》
由此可见,“他”“她”“牠”的并列,在汉字构形层面提供了一个观察近现代第三人称代词分化过程的直观视角。从字形部件出发,“他”以“亻”为形旁,“她”以“女”为形旁,“牠”以“牛”为形旁,部件差异在视觉上强化了所指对象的类别区分。原本具有泛指功能的第三人称代词“他”,在近现代书面语发展过程中逐渐被限定为男性专指形式;部分地区或语境中沿用“牠”指称动物等非人对象;而新造字“她”则被确立为女性专指形式。由此形成的构形并列关系,使性别与类别区分在文字层面获得了形式化表达。
所谓女性专称“她”,是在原有统一形式“他”的基础上分化而来的一种性别标记形式。从历时角度看,“他”及更早出现、用于指称非人对象的“它”,在使用上具有较强的泛指功能;相比之下,“她”作为后起形式,其语用范围自始即带有明确的性别限定色彩。值得注意的是,“她”的提出与推广发生于近现代语言规范化与书面语改革的语境之中,其形成过程涉及知识界倡议、社会舆论讨论以及不同立场的意见交锋。最终,该形式在标准书面语中得到确立并广泛使用,成为现代汉语第三人称代词体系的重要组成部分。
4. “她”的创制逻辑
(一) 标记论下“她”的创制
标记理论是结构主义语言学中一个重要理论,主要由20世纪30年代布拉格学派创立,各种语言中普遍存在标记现象,即一个范畴内部,存在两个对立的项目,其中一个有标记,或标记度高,其中一个无标记或者标记度低。如“数”范畴内,单数如“girl”无标记,复数“girls”有标记。
特鲁别茨柯伊也曾提出语言学中“将标记性定义为两个对立项中比较不常用的一项所具有的特别品质。”学者们常使用标记论与非标记论来分析意义的标准或者二元划分背后深层的表意机制。而“她”的创制则恰恰符合语言文字这一标记理论。
通过梳理“她”的创制过程和背后逻辑,可以推知,在文字原有部件“亻”和“也”的组合下形成“她”,“男”和“女”在古代已经随之分指两种性别,《说文解字》中指出“男,丈夫也;女,妇人也。”而近代将部件“女”替换部件“亻”与“也”构成“她”,并指明用于女性代称。将“女”这一构字部件抽出,在语义和语用上重新规定“他”与“她”的对立,构成了同一个范畴内的标记程度不同。
(二) 文化标出性下“她”的创制
语言与文化的关联非常紧密。虽然标记性理论最早运用在语言学领域,但语言与文化的深层联系使语言标记性与文化的关联也被大多数学者所关注,如费天翔(2020)从文化的标出性来看待社会及个体在男女平等上的性别文化现象[15]。语言学家斯科顿指出,“社群规则所预期的是非标出项,反之是标出项”。这说明,标出项与非标出项在社会性规则中的适用性,而这种规则即是社会文化的重要组成部分。赵毅衡(2008)通过符号学的知识,将语言学的“标记性”扩展至文化研究,特别是符号文化研究领域,并在原有的基础上引入“中项”概念来分析文化研究中概念边界模糊的情况[16]。在进行符号学研究时将“非标出项”称为“正项”,“标出项”称为“异项”,形成“正项-中项-异项”的文化标出性理论,并提出了“中项偏边”原则,即中项联合正项。正项是正常的、中性的,具有对“异项”的携带功能,而“研究文化标出性的出发点,是发现‘中项偏边’”。
虽然文化标出性理论与语言标记性理论在结构以及关注对象等方面都有明显的差异,但两者息息相关,语言学的标记性研究是文化标出性研究的基础,文化标出性通过语言传达。
“她”的创建逻辑,在语言学上,利用标记理论,将部件“女”替换部件“亻”与“也”构成“她”,将“女”这一构字部件抽出,在语义和语用上重新规定“他”与“她”的对立,构成了同一个范畴内的标记程度不同。并且利用语言的经济性,排除掉“男也”、“女也”等其它造字法,最终使“她”在使用中得到巩固。在文化标出性上,将统称的人称代词“他”确立为男性专属,将其中“亻”包含的女性划分在外,另造新词。即划分后的“他”属于“正项”,“她”属于“异项”。此种创制逻辑参与“她”的创制与使用中。
5. “他”分化后的复数形式与群体指称机制
(一) “他们”的分布规则与性别标记机制
在现代汉语第三人称复数系统中,“他们”与“她们”构成性别标记对立。“她们”专用于指称全女性群体;“他们”既可指称全男性群体,也用于指称包含男性成员的混合性别群体。按照现行通行规范,只要群体中存在男性成员,无论比例多少,通常均采用“他们”。同样,当群体由多数女性与少数男性构成时,也以“他们”作为复数形式。
从结构功能上看,“他们”在复数系统中具有双重分布:一方面承担男性专指功能,另一方面承担混合群体的泛指功能;而“她们”仅限于女性群体专指。由此形成的分布格局呈现出功能上的不对称性,即男性形式在系统中具有更广的覆盖范围,而女性形式则表现出语义范围的限定性。
这种分布模式体现了现代汉语第三人称复数形式在性别标记上的组织方式:以“男性形式 + 泛指功能”对“女性形式 + 专指功能”为基本结构,从而构成当前复数代词体系中的性别区分格局。
(二) “他们”在使用中的数据分析
黄秋华、陆伟明(2017)通过实证研究儿童阅读,指出“她”具有清楚的性别讯息,中文的性别标记具有不对称性[17]。本文选择互联网语言,搜集微博、小红书、豆瓣三个平台的语例,在明确指代对象包括男性和女性的条件下,考察“他们”的使用频率,进行比较与分析。
小红书是通过图片文字、视频笔记等方式分享生活内容的社区,也是兼顾经营电商的综合平台。豆瓣是以书籍影音为出发点,集品析、表达和交流于一体的网络服务APP。微博作为三者中用户基数最大的网站,是娱乐新闻和社会热点的社交媒体,其中用户群体年轻化。通过搜集以上三平台的语料,以此验证“他”划归男性代词后,“他们”在当前复数代词体系中的泛指功能。
本文共搜集150条语料,微博、豆瓣、小红书各50例,其中“他们”在语境中均明确指代群体包含男性和女性,忽略仅包含男性群体的语例,情况见表1:
Table 1. Proportion of generic use of “Tāmen (他们)” on Weibo, Douban, and Xiaohongshu
表1. 微博、豆瓣、小红书“他们”的泛指使用占比
名称 |
使用“他们” |
其它方式 |
“他们”占比 |
微博 |
50 |
0 |
100% |
豆瓣 |
45 |
5 |
90% |
小红书 |
47 |
3 |
94% |
数据显示,在指称群体时,“他们”的使用频率占据绝对优势。在150条语料中,仅存在两条在概括群体时使用“她们”,其中一条在指称女性占比更大的群体,见图5;另外一条在男女占比相同的情况下,使用“她们”,见图6。
Figure 5. Xiaohongshu uses the word “她们” (the feminine plural form of “they”) to refer to the group (five women and two men)
图5. 小红书以“她们”代指团体(五位女性两位男性)
Figure 6. Douban uses “她们” to refer to mother and father
图6. 豆瓣以“她们”代指母亲和父亲
数据表明,即便在女性占比较高的群体语境中,群体指称形式仍以“他们”为主要选择,其使用频率显著高于“她们”及“TA/ta们”等替代形式。在这一以“他们”为常规指称形式的语言实践中,女性成员被纳入男性化的泛指框架之中,从而导致女性视角在群体表述层面的结构性弱化与隐匿。
6. 其它标出性词汇的创造与分析
Asoulin, E. (2016)提出语言不仅用于交流,而且是促进、构建特定类型思维的机制[18]。在此理论视角下,语言形式的选择与创制并非中性的符号操作,而是深度参与社会认知结构的建构过程。“他”的性别分化及“她”的创造并非孤立现象,而是在特定社会文化结构中生成的语言结果。在以男性为默认范畴的社会语境中,围绕女性身份所形成的一系列“专用”表达,往往以标出形式存在,从而在词汇层面建构出性别差异的结构性区分。此类词汇在构形方式、语义指向及语用功能上均体现出明显的标出特征。本文将对若干相关词汇进行简要列举与分析,以揭示其背后的性别意识及语言机制。
(一) 在家庭身份中,如:
儿子–女儿 孙子–孙女 少年–少女
《说文解字》中将“儿”解释为:仁人也。将“子”解释为:十一月,阳气动,万物滋,人以为称。“儿”与“子”起初并无性别指向。“黄口小儿”、“妻子”中的“儿”与“子”也均指小孩子。在语言演变过程中,通过“女儿”、“孙女”等词将女性单独标出,“儿”“孙”则在语用中更易被理解为男性后代,这种从“中性”到“男性默认”的语义漂移,体现语言系统内部的性别重构机制,同样在“少年”“少女”的对举中体现。
(二) 在社会称谓中,如:
国王–女王 皇帝–女皇、女帝
国足–女足 学长–学姐
老板–女老板 程序员–女程序员
在权力与身份称谓层面,“国王”“皇帝”作为无标记形式,天然承担“统治者”角色;而“女王”“女皇”“女帝”则需通过显性标记进入该语义场域。这种构词方式不仅反映社会性别分工的历史现实,也在持续强化男性作为权力主体的认知模式。类似的语义结构亦可见于“国足/女足”“老板/女老板”“程序员/女程序员”等表达。职业名称在形式上原本无性别限定,但在语用实践中,女性参与者被视为“例外”或“特殊群体”,从而需要额外标记。这种“附加式标出”在认知层面暗示女性并非该职业或身份的默认承担者。
英雄–女英雄
尽管“雌”“雄”在词源层面本为对称的性别概念,《说文解字》分别释为“鸟母”“鸟父”,但在现代汉语中,“英雄”已脱离其性别构成的字面意义,成为评价性词汇的核心形式,并在语用上默认男性主体。当指称女性时,则需借助“女英雄”这一标出形式。历史上,“英雌”一词在晚清曾被创造并使用,然而,“英雌”并未在现代汉语中获得与“英雄”对等的通用地位,反而逐渐边缘化,显示出语言系统对男性本位结构的稳定维持。
同样引发讨论的,还有一系列与职业相关的称谓,如:
警察叔叔、农民伯伯、外卖小哥
食堂阿姨、宿舍阿姨、迎宾小姐
该类表达在构词层面将特定职业与性别身份绑定,职业分工的性别想象在语言层面得到固化。以2023年中央广播电视台春节联欢晚会节目中以“外卖小哥”统称外卖员,引发微博讨论。
综上,无论是以男性形式泛指全体,还是通过“女 + X”的形式对女性加以区分,均体现了结构性的话语安排。这种语言并非简单的形式差异,正如认知语言学所强调的,语言不仅反映也参与构建社会现实。正如刘颖(2022)年指出“性别是与社会感知和判断相一致的建构,而这种建构的重要手段之一就是通过语言[19]。性别标出词汇的生产与使用,在无形中塑造着性别角色的认知框架与价值排序,从而在日常话语层面再生产既有的性别秩序,
7. 结语
本文通过系统考察“他”的语法化进程,梳理其由实词向人称代词演变的历史脉络,并在既有研究基础上,将其发展划分为四个阶段:一是作“其它”义使用;二是作“他人”义并常与相关成分对举;三是指代功能确立而原有语义基本消退;四是至唐代第三人称代词意义的真正成熟与定型。在此基础上,文章进一步关注现代汉语人称代词“三分”格局的形成,重点分析新造字“她”的产生过程及其内在逻辑。通过梳理“也”“他”“佗”“牠”等字形与功能之间的关系,结合标记理论与文化标出性视角,从语言结构与社会文化两个层面探讨“她”之创制所折射出的女性身份特殊化及其背后的结构性缺位。
在此基础上,本文进一步讨论“他”在性别分化后对复数形式“他们”所产生的影响,通过对微博、豆瓣与小红书三个网络平台的语料搜集与统计分析发现,即便在女性占比明显较高的群体语境中,当指称包含男女成员的群体时,“他们”仍占据绝对优势,显示出男性形式作为默认范畴的稳定性。
文章最后列举若干其他具有标出特征的性别相关词汇,简要分析其背后的共通机制。基于语言作为思维工具的理论立场,可以看到,在标出性结构影响下所形成的一系列词汇实践——无论是“她”的创制、“他们”的泛指使用,还是其他性别标出表达——均在不同程度上参与了性别认知框架的建构。
然而文章还存在诸多问题,如“佗”隶变“他”时期,两者的使用是否可以同时划分作“其它”意义?即上古时期表示“其它义”时,“他”和“佗”是对立还是互补?还有如“她”创制时期,关于“伊”和“渠”等其它女性称谓也有待进一步探索。