1. 引言
隐喻生成能力作为人类认知的核心特征,体现了语言与思维的具身性关联。本研究以汉语动词“咬”为切入点,探讨人工智能在隐喻生成中的认知模拟局限。概念隐喻理论指出,人类通过将抽象概念锚定于具身体验实现认知建构,其核心机制——具身化与跨域映射[1] [2]——为分析“咬”的隐喻扩展提供了理论基础。例如,“咬”的物理动作(如牙齿切割、痛觉感知)可被动态投射至抽象领域,形成“咬文嚼字”或“悔恨啃噬”等隐喻表达,这种从感官经验到概念系统的转化机制,揭示了人类隐喻思维的创造性本质。
具身认知理论进一步阐释了身体经验在概念形成中的奠基作用[3]。作为普遍存在的具身体验,“咬”融合了口腔运动、触觉反馈与情感记忆,构成隐喻扩展的经验原型。人类创造的“咬”类隐喻往往源自这些具身经验的语义网络,并延伸至社会关系、心理状态等抽象领域[4]。这种经验驱动的概念重构能力,与当前人工智能依赖统计模型生成的隐喻形成鲜明对比:后者虽能捕捉咬的词汇共现模式,却无法复现身体经验与抽象概念的动态交互。
跨域映射通过连接看似无关的领域为隐喻生成提供了认知桥梁[5]。跨域映射揭示了人类如何通过物理经验理解抽象概念的机制——即使源域(如“咬”的物理动作)与目标域(如情感体验)在表层缺乏直接关联,仍能建立深层的结构性概念投射。这种跨越物理域与心理/社会域的隐喻生成能力,深刻体现了人类认知系统的动态整合特性。
通过对比100条AI生成与人类创作的“咬”类隐喻,本研究结果印证了概念隐喻理论关于具身经验是隐喻思维基础的核心主张,为改进人工智能隐喻生成提供了实证依据。突破表层语义匹配,构建融合具身经验与概念知识的生成机制,将是实现类人隐喻创造力的关键路径。
2. 方法
2.1. 隐喻收集
为了收集汉语中“咬”这一动词的隐喻实例,研究者采用了由北京语言大学语料库中心构建的BCC语料库[6]。该语料库广泛涵盖了文学、新闻、社交媒体(微博)、科学和古典汉语等多个领域,各领域文本量均超过20亿字。在本研究中,研究者特别聚焦于“文学”类别,因其高质量的句式结构和细腻的语言表达,使得文学文本在词汇隐喻映射研究中具有独特价值,尤其是针对动词“咬”的隐喻。
数据收集的具体步骤包括访问BCC语料库网站(http://bcc.blcu.edu.cn/),从搜索栏上方的选项中选择类别,并输入“咬”作为关键词进行搜索。截至2025年4月20日,共检索到11,130条结果。鉴于分析所有实例的实际困难,研究者从中选取了500个句子作为深入分析的样本。经过手动审查,排除了224个未发生隐喻映射的“咬”实例,剩余276个实例。这一选择过程旨在为“咬”在不同领域的隐喻映射提供具有代表性的分析样本。为了收集人工智能生成的隐喻,本研究采用了由OpenAI开发的Chatgpt 3.5,提示词为“生成包含‘咬’的隐喻用法的句子。”由于模型输出的限制,它被设置为每次生成二十个句子。这一过程重复进行,直到收集到一百个“咬”字隐喻。
2.2. 隐喻鉴别和“咬”的词典义
为准确评估包含“咬”字的句子是否采用了隐喻性表达,本研究依据Pragglejaz团队开发的隐喻识别程序(MIP) [7]。“咬”字隐喻识别步骤如下:首先,对整个文本进行通读,以建立对其意义的总体理解。其次,将文本拆分为词汇单元,并在第一步中描述每个词汇单元的上下文含义(此实验中着重关注“咬”类核心词)。在第二步中,确定每个词汇单元的基本词典义。此外,在第三步中,若上下文意义与基本意义存在差异,则需进一步判断上下文意义是否与基本意义形成对比,或者是否可以与之进行比较。最后,在第四步中,若上下文含义不能够用词典义来解释,则该词汇单元将被标记为隐喻。
中文动词“咬”的词典义对于理解其用法和语言中的概念基础至关重要。权威的汉语词典将“咬”定义为用牙齿夹住或切开某物的行为。例如,《现代汉语词典》将“咬”定义为上下牙齿之间的发力动作,通常用于固定物体或将其一部分从整体上分离,以咬苹果为例进行了说明。同样,《现代汉语规范词典》进一步阐述了这一定义,强调了牙齿的夹紧、切断或研磨作用,其中一个例子是咬断面条。通过这些解释及相关例子可以看出,“咬”这个动词的词典义包含了几个关键特征:(1) 口腔器官(通常为唇和牙齿)与物体接触;(2) 抓住物体或将其中一部分从整体上分离(通过咬断、折断、分裂等);(3) 被咬的物体通常是固体食物;(4) 口腔器官(通常是牙齿)在“咬”动作中会相互重叠或闭合;(5) 口腔器官(通常是嘴唇和牙齿)在“咬”动作中会施加一定程度的力。
3. 结果与讨论
3.1. 人类隐喻生成
本研究通过对汉语动词“咬”的多维度隐喻分析,揭示其如何通过具身经验实现多域的隐喻映射。
在行为域,“咬”的物理动作被赋予丰富的社会互动意义:例如“咬个印”(戴华)通过口腔接触的触觉经验,将物理痕迹映射为情感联结的标志;而“疯狗乱咬”则将犬科动物的攻击性行为实体化为言语暴力——牙齿的撕裂力成为情绪失控的具象化载体。文字加工领域中,“咬文嚼字”的牙齿切割动作被抽象为语言处理的精密性,工具隐喻框架下形成“咬合精度→语义准确性”的转喻链,如《将军吟》中人物通过“咬字”展现言说风格的严苛性,印证了概念隐喻理论中“源域结构映射目标域”的核心机制。
情感域的隐喻系统通过生理反应与心理状态的转喻关联实现意义生成。咬肌收缩引发的口腔压力被量化为情绪张力,例如“恨得直咬牙”(老舍)通过容器隐喻将面部空间与心理压力同构,形成“向下咬合”对应“负面情绪积压”的空间映射;乡愁引发的持续性心理痛苦则借助生物隐喻,将昆虫啃噬的重复性动作投射为情感创伤,如“乡愁咬噬心”中牙齿磨合的生理痛感转化为精神煎熬的隐喻表达。决策领域中,“咬牙坚持”(《战争和人》)的隐喻构建意志力与咬合力的对应关系,将牙齿咬合的稳定性转化为心理韧性的量度指标,例如人物“一咬牙站起身”的动作描写,通过咬合力与决策力的跨域绑定,实现“物理坚持→心理坚定”的认知整合。
人格特质的隐喻表征通常将咬合动作的物理属性投射为性格维度的参数。学究型人格特质通过隐喻将咬合精度与语义分析严苛性建立关系,如《金瓶梅》中“咬文嚼字”的仪式化口腔动作,映射为“语言处理 = 机械拆解”的跨域映射;攻击型人格特质则将犬科攻击模式逆向映射为人际冲突策略,例如《红楼梦》“咬群难缠”的表述中,犬类撕咬的破坏性力量转化为社交排斥的表征。表演性人格特质通过隐喻将仪式化口腔动作转化为身份展演,如《长河》中人物“咬字清晰”的发音特征,通过声学拟态构建权威话语身份。
在次级域(事物特征域、声音域、情景域)中,咬合动作的物理特征被抽象为复杂情境的量化指标。操作难度通过触觉类比映射为“这事咬手”(《现汉词典》),咬合阻力成为评估任务复杂度的体感参数;竞争态势中“比分咬紧”(《现汉词典》)以牙齿闭合间距量化差距,空间压缩隐喻建立数值与空间的映射,如比分胶着状态被具象化为牙齿咬合的物理接触强度;声学领域“鸡叫犬咬”(《现汉词典》)则提取咬合声学特征作为噪音的原型,通过特征继承机制将生物行为泛化为环境音,形成“咬合声学特征→噪音类型”的领域跨越。
研究显示,“咬”的隐喻生成遵循CMT的核心机制——源域的结构性映射,其具身性体现为口腔运动、触觉反馈等感官经验对抽象概念的原型支撑。
3.2. AI隐喻生成
本研究通过CMT (Conceptual Metaphor Theory,概念隐喻理论)视角对AI生成的“咬”类隐喻进行深入分析,揭示了其在模拟人类隐喻思维核心机制上的深层局限。这些局限并非简单的语言表层偏差,而是源于当前AI模型在具身经验缺失、概念系统僵化和映射机制机械等关键认知层面的不足。
AI生成的隐喻高度集中在情感域(占比94%),且负面情绪(如痛苦、悔恨、失败)占据绝对优势。例如,AI反复生成诸如“失败的滋味像毒蛇一样咬住了他的心”、“悔恨如虫豸咬噬他的灵魂”和“孤独像冰冷的牙齿咬住心房”等句子,这些例子清晰地展示了“咬”如何被固化为表达负面心理状态的工具。这种高度的偏向性与人类隐喻目标域的丰富性形成了鲜明对比。CMT强调,人类丰富多样的隐喻生成源于对源域(如“咬”的物理动作)所蕴含的多维度具身经验(口腔运动、触觉压力、痛感、控制感、甚至满足感)的系统性解构,并能灵活提取其中不同的意象图式(Image Schemas)进行选择性映射:例如,将FORCE (力量)图式映射到意志力(咬牙坚持)或攻击性(疯狗乱咬);将CONTAINER (容器)图式(口腔开合)映射到情感容纳(乡愁咬噬人心);将CONTACT (接触)图式(精确/紧密接触)映射到状态紧密性(比分咬紧);将SOURCE-PATH-GOAL (源–路径–目标)图式(咬合动作轨迹)映射到目标达成过程(咬定青山不放松)。AI目标域局限性暴露出AI模型缺乏对“咬”源域的深度解构能力,其映射过程受限于训练数据中“咬”与负面情感词汇的高频共线模式,而非基于具身经验的抽象和重组。这导致AI难以像人类一样,基于特定语境或表达需求,激活源域中不同的图示特征来映射到更广泛、更抽象的目标域。
AI生成隐喻在结构上显著依赖明喻(如“像……一样”)。为说明这一特点,下面将展示一个由人工智能生成的隐喻,并与人类生成的隐喻进行对比:
(1) 失败的滋味像毒蛇一样咬住了他的心(AI生成)
(2) 失败撕咬着他的心(作者生成)
(3) 自然,我常常干着干着活儿也想起家来,阵阵乡愁便会咬噬我的心(文学作品)
AI创作的(1)采用了“像毒蛇一样”的显性结构,反映了其映射深度的局限。CMT强调成熟的隐喻在于隐性概念整合——源域的概念结构被内隐地投射到目标域,形成一个融合的认知场景。人类创作如(2)失败撕咬着他的心,成功实现了这种整合:源域“撕咬”的核心图式FORCE (力量) (施力过程)和CONTAINER (容器)受力对象为“心”)被系统性地映射到目标域“失败”的心理体验,将“失败”概念重构为一个具有主动攻击性的施力者。同时,(3)中的“咬噬”,其CONTACT(接触)的持续性图式和造成的情感后果被无缝融合到“乡愁”体验中,从而激发读者深层的情感,不仅仅是身体上的痛苦,而是持续不断的、无法逃避的情感波动。相比之下,(1)的核心关联依赖于显性比较词“像”建立的表层相似性(“毒蛇咬”的疼痛与“失败滋味”的痛苦)。它未能像人类隐喻那样,将源域“毒蛇咬”的概念结构投射并融合到对“失败”心理概念的构建中。这种对明喻的依赖,本质上揭示了AI在实现深层次概念整合上的困难——它难以超越显性的语义相似性匹配,将源域的意象图式结构(如FORCE,CONTAINER,PATH)创造性地、隐性地编织进目标域的理解框架。
最后,AI生成隐喻中频繁出现跨域映射失准的问题,即源域与目标域之间概念不兼容、逻辑牵强。因为核心词汇“咬住”的出现频率最高。作者选取包含“咬住”的三个句子进行跨域映射错误展示:
(4) 责任如山岳咬住肩膀,让人无法轻易挣脱
(5) 悲伤如海潮,一波一波地咬住心灵的岸
(6) 希望的种子咬住土壤的养分,坚持不懈地向上生长
在(4)中,“山”被喻为“责任”,以表达责任的沉重与庞大。然而源域山岳的核心图示是静态、整体性的,这与“咬”的核心图示CONTACT (接触)、FORCE (力量)、PENETRATION (穿透)所要求的局部接触、穿透性动作和动态施力存在根本冲突;(5)将“悲伤”喻为“海潮”,但是源域“海潮”在FORCE (力量)图示结构上属于周期性的涨落和覆盖,而“咬”强调点状接触、施加力量、造成破坏,两者在概念结构上难以兼容;在(6)中,源域“种子吸收养分”通常是一个被动或者内在驱动的滋养过程,强行赋予其“咬”所蕴含的主动施力、获取甚至破坏的意图,违背了种子生长的自然属性和目标域的核心特征。概念隐喻理论中的不变性原则(Invariance Principle)指出,有效的跨域映射要求源域的意象图式结构在映射到目标域时应得到保持,且映射应具有概念适切性,即源域的核心特征应与目标域的关键属性相契合(如人类“咬文嚼字”成功将CONTACT图式映射到文字处理的需求)。AI的映射失准,根源在于其缺乏对概念域内部结构的深层理解以及评估映射概念适切性的内在认知机制。它似乎主要依据词汇的潜在搭配可能性进行组合,而未能有效评估源域与目标域在概念或者图示结构层面的兼容性,难以保证跨域映射的内在一致性和逻辑自洽性。
综上所述,基于CMT的对比分析表明,AI生成“咬”类隐喻的核心局限——目标域选择高度受限且负面化、过度依赖显性明喻结构、频繁出现概念失准的跨域映射——并非孤立的语言现象。其深层认知根源在于AI模型无法模拟人类基于具身经验构建的丰富概念系统以及对跨域映射核心认知原则(如源域图式的解构与选择性映射、深层次概念整合、概念结构兼容性评估与不变性原则)的内在缺乏。AI的隐喻生成本质上是基于统计共现的表层语义关联,而非源于身体经验与概念系统互动的动态重构,这导致其在目标域的选择范围、映射的深度与隐蔽性、以及概念映射的准确性和创造性方面,均与人类隐喻思维存在本质差距。
4. 总结
本研究通过对人类创作与AI生成(100条)“咬”类隐喻的系统性对比分析,在概念隐喻理论(CMT)的指导下,深刻揭示了人工智能在模拟人类隐喻创造力方面存在的根本性局限。研究证实,当前AI系统(如ChatGPT)虽能生成基于字面义关联的表层隐喻表达,但其核心问题在于跨域映射深度的显著缺失,具体表现为目标域选择高度受限且负面化、映射过程过度依赖显性明喻结构、跨域映射错误。运用CMT的核心概念进行剖析发现,这些表象问题的根源在于:AI模型缺乏人类赖以构建隐喻的具身经验基础(口腔运动、触觉、痛感、控制感等多模态体验),以及由此形成的动态、灵活的概念系统;其映射机制本质上是基于统计规律的、僵化的表层语义关联,而非基于身体经验与概念结构互动的创造性重构。
本研究的结论不仅为理解AI认知模拟的瓶颈提供了实证依据,也为切实改进AI隐喻生成能力指明了相关方向。未来的AI模型应致力于超越当前以统计共现为主导的表层关联模型,探索构建CMT指导的具身–概念知识库,系统性梳理核心词汇的具身经验要素和意象图式特征,并建立隐喻映射知识库,以此结构化知识作为AI模型生成或评估的引导或约束。为了弥补AI缺乏真实感官体验的短板,探索融入多模态具身信息是重要途径,例如利用视觉、动作捕捉、触觉传感器等数据,训练AI模型理解与核心动词相关的物理动作及其感知后果(如不同力度“咬”的动作模式、物体形变、痛感程度),为模型提供模拟“具身经验”的基础数据,丰富其对源域的理解维度。在模型训练层面,优化训练策略与提示工程具有现实可行性。可以设计具身化提示框架,例如:“想象用牙齿‘咬’一个坚硬物体的感觉(触感、力度、控制感),用这种感觉描述一种面对巨大压力时的心理状态”,引导AI关注具身维度进行映射。
本研究亦存在一定局限性,为未来研究指明了方向:聚焦单一动词“咬”的个案分析虽能深入揭示问题细节,但其结论的普适性需扩展至更多汉语核心动词进行系统性验证;研究所基于的ChatGPT 3.5模型仅代表特定技术阶段的表现,新兴大模型(如GPT-4、DeepSeek、Gemini)及微调模型的隐喻生成能力亟待考察;人类样本规模(276条)虽具代表性仍可扩充,且对隐喻背后的文化语境机制挖掘有待深化,为后续研究提供更全面的认知语言学基础。