电商平台智能客服的适老化升级方案——增设方言语音识别功能的可行性探析
Aging Upgrading Solution for Intelligent Customer Service of E-Commerce Platform—Feasibility Analysis of Adding Dialect Speech Recognition Function
摘要: 随着数字经济的发展及老龄化社会的到来,作为日渐庞大的消费群,“银发族”已然成为电商消费市场的新的发力点。方言使用与平台标准话交互之间发生的矛盾现象会不断阻碍老年人实现有效数字融入的进程,在此基础上,本文提出关于智能化适老性升级改造中对平台智能客服的“银发族”改造升级的设想,并对其进行基于用户需求、技术、政策及商业等方面的可施行性的详细探讨。
Abstract: Under the background of the double acceleration of the digital economy and aging society, the market value of “silver-haired people”, as the new increment in the consumption of e-commerce, is becoming more and more prominent. However, the conflict between the use of dialect and the standardized interaction of platforms is becoming an interactive barrier to the digital integration of many elderly groups. This paper focuses on the aging upgrade of intelligent customer service, proposes the aging upgrade program of dialect speech recognition for intelligent customer service, and systematically explores its feasibility from four aspects, namely, user demand, technology, policy and business.
文章引用:张凤瑶. 电商平台智能客服的适老化升级方案——增设方言语音识别功能的可行性探析[J]. 电子商务评论, 2025, 14(6): 2792-2798. https://doi.org/10.12677/ecl.2025.1462053

1. 引言

随着电子商务快速发展以及老龄化进程不断加快,适老化方案及其升级成为各个电子平台所关注的要点,第54次《中国互联网络发展状况统计报告》说明,50岁以上“银发族”群体在新增网民数中所占比例为36%,移动支付产业各方积极推动适老化升级,截至2024年6月我国60岁及以上网民网络支付的使用率已经达到75.4%,老年群体已然成为电子商务消费大军中的一部分。然而在自主完成线上购物流程时,不少老年人依旧面临与电商平台语言交互方面的险阻,《适老化技术应用白皮书》提到,超过六成县域老年人存在因方言导致的智能交互障碍,在国家持续推进“智慧助老”专项行动的政策环境下,探索方言语音识别功能的适老化升级方案,有多重现实可行性。

2. 适老化设计与方言交互的关联逻辑

适老化设计可以追溯到20世纪50年代,其始于无障碍设计,发展于通用设计、包容性设计等,兴起于信息时代的不同设计语境[1]。它最早将老年人群定位为公共生活的弱势群体,应当对其予以特殊的关照,因此那时的研究大多集中于建筑、公共设施的设计及应用上。随后,随着科技的进步及老龄化进程加快,适老化也逐渐由先前应用于住房、交通等物理空间范畴中,向数字领域拓展。解决老年人在运用智能技术方面遇到的困难,让老年人更好共享信息化发展成果,已成为适老化最重要内容之一[2]。数字化时代下,适老化设计是一种从老年人的身心特点及特殊需求出发,使用技术手段开展系统化、包容性的改造活动的过程。它是采用技术消除数字鸿沟和环境障碍,让老年人同享科技进步带来的生活便捷的一项优化升级举措。立足老龄化社会背景,注入新的功能内涵赋予老年人群体主体化角色,是人本化设计理念的重要体现;促使老年群体在舒适满意的环境中健康生活,无疑是引领银发经济高质量发展的手段。

21世纪以来,随着社会科技化进程的不断推进,当代适老化的理念在内涵上又更进一步:不是片面强调“以更多的服务设施和关怀举动,让老人安度晚年”,而是更倾向于“利用技术手段填补因各种原因(例如身体衰老、代际差异)带来的沟通障碍,为老人赋能,让老人也能够拥抱时代变化、共享数字化成果、并增强自己的技术自控力”的思想内核。认为在信息现代化的当下,产品交互的“适老化”要考虑老年人的身心状态、认知水平及所处环境等各方面因素特点,通过技术手段弥补交互问题,促进其主体性的发挥[3]。由此得知,老年群体数字融入面临的首要障碍就是语言方面的交互——因为有的老年群体比较常使用方言而不能顺利进行智能化进程时,会产生较大的困扰;因此方言语音识别的功能适配就是在满足了老年群体的话语习惯需要之后的一种适老化设计,它的落脚点就在于数字交互场景中对老年群体的需求的理解。

此外,关于用户接受新事物的原因也被适老化作为重要研究对象。Venkatesh等人的技术接受模型(TAM)认为:对用户接受新技术起决定作用的是他们认为新技术的“感知有用性”以及新技术使用的“感知易用性”。曹贤才、张浩等人(2025)在TAM的基础上列入老年群体的个人特质变量,进行元分析后得出结论:感知技术功能特征、感知技术情感特征和环境特征相关变量与行为意向显著相关; 老年人个人特征中技术自我效能感和行为意向高度正相关[4]。由此可见,技术在老年群体中的接受度与其生命周期长短有较高的耦合关系,一方面体现技术本身的易用性和功能性的特性决定了其能否被老年人接受,适老化改造首先要考虑的就是要怎样让技术更贴近于老年人生活场景;另一方面也反映了老人能否积极主动应用某种技术依赖于当前使用情境和老年人自身的技术自控能力等因素。对于电商平台适老化的升级而言,在新技术革新中嵌入具有情感联结的技术功能的同时,注重培养用户的自我效能感,技术适老化应当从工欲到文化陪伴范式的转型升级方向上思考进行升级。下文主要论述方言的功能及其如何契合适老化要求。

3. 方言的核心功能及其适老化价值

3.1. 方言:语言多样性的实践载体

语言作为一个民族的标识,方言则是一个社群的标识[5]。方言是一个地区或社会阶层人群使用的语言变体,是同一种语言在不同区域下不同的分支。方言不仅是地域文化的载体,也是承载了地方历史和集体记忆的载体,不同的方言区具有独特的语音、词汇和语法。汉语《中国语言地图集》中将汉语方言分为10大系,其中吴语、粤语、闽语等主要方言区之间存在较大的差异性(区别度大于30%),各自形成别具特色的语音、词汇、语法体系。而随着数字化时代的到来,多样的语言开始向着同质化发展,但从另一方面来说,多种不同的方言又给予技术差异化开发留出了可能性的空间。对于老年群体来说,方言不仅仅是一门语言,在它的背后包含的是各种文化,并且有着很强的适老属性,适老服务人员也要充分挖掘方言这一宝库,让更多的老人摆脱数字鸿沟。

3.2. 方言的功能

3.2.1. 身份认同构建功能

方言作为地域文化身份的关键标识,意义重大,依据中国互联网信息中心所发布的《第51次中国互联网络发展状况统计报告》,有67.5%的老年网民说明,使用方言可提升他们在数字环境里的自我认同感,这份报告清晰显示,在粤、闽、吴这三大方言区,老年用户对于支持方言交互的电商平台的信任度,相较于普通话平台要高出21.3个百分点。国务院出台的《“十四五”国家老龄事业发展和养老服务体系规划》明确提到要加强方言识别技术研发,以此保护老年人的语言文化权益,这从政策层面证实了方言对老年群体数字身份重构所起到的作用。

3.2.2. 情感共鸣强化功能

与情感记忆存在深层认知联系的方言语音,通过语音的音高、音律及词汇系统能激活某些特定的脑区和神经通路使情感唤醒的效率更高;而经神经科学研究发现,母语方言也能使人大脑边缘系统和语言处理皮层协同活动的程度加强,这样使得人们说话交流时,用方言的方式去表达要比用普通话去说更容易得到积极情感回馈。由方言与人产生强联系并加入个体成长经验而形成的“情感锚点效应”或可解决平台型数字服务中长期存在的技术使用认知焦虑问题,并有助于改善用户对数字服务信任度下限;而形成这种效果的基础主要是对声音要素和相关文化情境的双层分析判断,从而将技术交互提升为一种情感联结。

3.2.3. 群体归属维系功能

方言可以通过在数字空间中重构属于该种语言的语言领地来筑起一道抵挡算法孤岛的文化屏障。根据国家统计局发布的《2023年老年群体数字行为调查》可知,在用方言上网的老年网民中,有68.5%人会组成基于语言认同的线上社群,他们与群友之间的月均互动频次达4.3次,比常人用户多出1.8倍,所以就有了这种“语言领地”,而造成上述这种“语言领地”的根本原因是方言这三种功能:文化密码性的筛选功能、共用的语言符号加强互信的作用和地方性知识助力建立不用受平台算法推荐影响的消费决策标准等等,以此体现语言共同体对技术权力的作用。

3.3. 功能视角下方言的适老化价值

从功能视角来看,方言具有从用户个体需求到群体需求的适老化价值,见图1。方言圈作为一个稳定的文化社群,在满足用户主体性、情感性以及群体归属需求的同时,其中蕴含着数字经济效益转化的潜能。

Figure 1. User requirements analysis diagram in dialect functional perspective

1. 方言功能视角下的用户需求分析图

3.3.1. 身份认同需求:文化主体性的数字重建

方言是地区身份的重要标志,方言和地方文化有深刻的联系,老年群体使用普通话为主要语种的数字平台时,容易产生“数字身份割裂感”,因为在标准化的交互流程中个人熟悉的语言符号、表达习惯等都会消失,失去了一个语言运用载体,从而在技术和使用者之间产生了自我的认同危机。方言识别,则是通过技术为用户提供一种“语言身份锚点”的修复方法,例如“落雨”、“厝边”这样的话题出现在聊天场景之中后,平台不仅接收到了聊天信息,而且确权了用户的话语权,这种身份重建能够缓解老年人群由于语言异化带来的技术疏离感,使他们重新进入数字世界之中找到“在场感”,增加其对平台的信任基础,帮助电商平台通过增加老年群体在使用数字平台的过程中形成更高的技术自我效能感实现提高用户黏性的目标。

3.3.2. 情感共鸣需求:乡音记忆的技术唤醒

方言的声调韵律同人的感情记忆深度绑定在一起,被证明通过神经语言学研究发现,母语方言的语音能够触发大脑边缘系统中负责怀旧记忆的中枢——“乡音情感共振效应”;当老年用户的电商平台在用方言同智能客服交流时,“早晨”“巴适得板”等方言词语中的语音发音也含有语义信息之外的声学特性,使用户获得相同语境下的情感体验。同时,情感共通点还带来了其他双层效益:第一层是在老年用户技术使用层面为降低用户技术认知负荷创造先决条件,即用户无需对该方言词进行解释便可察觉其中包含的特殊语义;第二层是在数字交互场景下,是促进文化融入的软实力输出点,即将枯燥的机械式操作变为了含情脉脉、具象化的动作行为。当用户端的理解被技术系统得到认可,那么用户的技术焦虑也会因此消解,人机交互中的“冷感”转而成为具身化的情感联结。借助这一有效诉求逻辑路径,电商平台方案的适老化改造得以实现从功能易用到情感联结的升级进阶,并由方式层面的功能性陪护实现了向形质一体的文化性陪伴蜕变。

3.3.3. 群体归属需求:文化社群下的数字经济

方言社群的数字聚合以本地语言文化为基础重构了传统经济活动中参与主体的行为模式,并且形塑了一个有别于商业市场异化逻辑的地方性“经济生态”。其中,“方言资源的间接经济价值则体现在方言作为一种交际工具,对经济发展有促进作用方面。”[6]于电商场域下,方言不仅是人与人之间沟通的重要工具,还是能够激起区域消费活力,并打破原有供需关系的媒介,老年用户的方言互动实现了建立地域特色消费社群的强连接,在此之上,基于用户的定义和算法供给之间结构化的差异化匹配也得到了重塑,即方言社群中的供需搭配遵循文化资本引导下的共识主义,共享语言与地方知识的方言空间下蕴含着一套独属于该地商品体系的语言符号体系与评价标准——粤语社群所赋予的商品“平靓正”属性,或吴语群体对“时令货色”的偏好等等,都把当地的生活消费文化打包成了经济层面上可以量化的指数参数,实现了从原先的大数据后台的“猜你喜欢”变成了小范围方言圈子的“都认为好的东西才算是好”,并且建立起了一种更易使人建立信任度的交互模式,而在方言社群这块有着强关系属性的地域型亚区市场中形成的对于数字经济的信任机制,是源于开放市场上以平台背书的信息平等交换变成的是方言集群语境下的乡音认证和熟人连带之信任链路,它的出现消除了市场上信息不对称的现象,使其产生更多黏性强的地方经济循环圈。此类凭借方言作为沟通交流的桥梁,能够调动地方特色产业数字潜能:撬动本土中小商家通过“原生态语言”展现非遗、老字号等作品,将“小而美”的地头经济主体拉动出原产地,漂洋过海地驶入广袤的全国市场。

方言是文化之船和差异化营销的方式,是“语言–文化–产业”的共生繁荣。对于电商平台来说,方言社群的融合也是一种平台层面从“流量逻辑”走向“文化逻辑”的深处演进,这既不是数字货架式的简单等价物交换场域,也不是主客体对立分离的“象牙塔”,而是呈相互嵌入状,在城乡小场景勾连起的人地关系空间场域,从某种程度上说是实现了老年人以文化属性完成消费自主的一跃、也使平台打开与地域经济发展的增量入口,由此可以借助技术普惠与文化留存一同达成双赢共荣、普惠于新时代的发展实效。

4. 增设方言语言识别功能的可行性分析

4.1. 技术可行性分析

目前语音识别领域的技术突破给电商平台增加方言功能提供了技术基础。“机器快转方言的相关技术正在迅速发展,如国内某智能语音行业龙头企业的输入法产品已经可以做到粤语、四川话、闽南语等23种方言的语音识别与输入。”[7]基于深度学习的端到端语音识别框架(Conformer, Wav2Vec 2.0等)结合预训练与微调的方法也可以很好地处理汉语方言复杂的声学特性问题。阿里巴巴达摩院DFS MN-CCT (Cross-Dialectal Shared Phonetic Representation)模型也用到了跨方言共享音素表征技术,在此之前已经有大量高资源方言(如粤语)的声学知识被用来训练少量的低资源方言(如客家话)的相关识别模型,且在吴语、闽南语等方言上的识别精度达到90%以上[8]。此外,在标注数据十分稀缺时,考虑到模型训练过程中需要大量的标注数据,采取一种业内较流行的方式是“机器快转方言的相关技术正在迅速发展,如国内某智能语音行业龙头企业的输入法产品已经可以做到粤语、四川话、闽南语等23种方言的语音识别与输入。”,即“机器快转方言的相关技术正在迅速发展,如国内某智能语音行业龙头企业的输入法产品已经可以做到粤语、四川话、闽南语等23种方言的语音识别与输入。”其中,由厦大信息科学与技术学院副教授洪青阳带领的科研团队研发的“闽南语识别”app便是典型的例子,据该团队介绍该app闽南语识别、输入的准确率高达85%。

对于工程化而言,有诸如TensorRT加速引擎等轻量化部署方案:模型压缩至50 MB之内,推理延迟不超过1.2秒,完全符合电商客服场景的实时交互需要;方言混合识别使用了层级化解码方式,在方言大类(如闽语系)的大类选择基础上再去选择细分方言(如闽南语或者闽东语),这样能更好地利用系统资源;通过动态热词更新机制来抓取用户的使用习惯,比如会把用户喜欢使用的频率比较高的“物配”词语加入到相应的语言模型里来,并将其使用在细分场景里,这一系列动态的改变也使得此精细化度非常高的语言模型在细分场景下的识别准确性提升了近19%。因此,不论是算法技术创新还是从算法创新到工程落地,都已全部达到完备程度,这也为电商平台实现模块化升级后的直接部署方言功能、无需重建已有系统提供了有力保障。

4.2. 政策可行性分析

我国政策层面提供了电商平台增加方言识别功能的坚强制度保障,国务院发布的《“十四五”国家老龄事业发展和养老服务体系规划》明确提出了“推进智能技术适老化改造,加强方言识别、语音交互等技术的研发”,从国家战略层面上明确了语言包容的技术路径;工信部《互联网应用适老化及无障碍改造专项行动方案》把“方言语音支持”也列入到改造清单中来,电商类App需要提供至少3种方言的语音交互功能,并且通过适老化认证的企业可以获得税收减免、优先采购等方面的政策激励;在语言保护方面,新修订草案的《语言文字法》增添了“方言数字化保护”的规定,要求公共服务平台“在保障国家通用语言文字主体地位的前提下,为方言使用提供必要的技术支持”,除了在国家级层面积极做好相关政策制定和指导之外,一些方言大省,如广东、福建等地也出台了方言相关政策性文件,例如出台《广东省岭南语言文化保护条例》,对于开发方言智能应用的企业,给予一定的财政补贴奖励。行业标准《信息技术,适老化通用设计规范》《智能语音交互系统技术要求》确立技术实施框架,“适老版应用应支持方言语音输入输出”,并明确要求规范方言识别准确率和响应延迟等量化指标,协同政策出台“中央立法定方向、部委标准强约束、地方激励促落地”的三层保障体系,破除平台电商方言功能升级的技术壁垒和制度桎梏。

4.3. 商业可行性分析

就电商运营来说,增加方言语音识别功能具有直接的资金投入产出比,同时也具有差异化市场竞争的优势。根据工信部发布的《数字适老化改造成本分析报告》,以1万智能客服系统为例,改造其方言模块的投入约占全部投入的12%~18%,且政策补贴约占到30%~40%,那么该公司所承受的初投比例则为60%~70%。收入上看,带有方言属性平台的老年用户留存率会提升25%~35%,客诉处理效率提升40%,客服人员的人工成本也下降了,有第三方机构做过测算:带有方言功能的老年用户群体将年均消费额提高到1200~1500元,从而能够给公司带来2.3%~3.7% GMV的增长点,抢占市场方面,由中信息院发布的《数字适老化改造成本分析报告》数据显示:当今支持方言的主流电商平台仅有21%,先期使用方言的老字辈电商平台可以抢先布局并获得3.2亿量级的方言老年用户,形成差异化的服务壁垒;从长期发展的角度上来说,提高用户粘度是降低获客成本的有效手段,通过方言功能的作用区域特色商品供应链有效延伸与非遗、老字号等文化消费场景不断扩大,受到政策利好及市场前景的双线驱动,该项目1.5~2年回收期兼具经济效益与社会效应。

5. 结语

电商平台智能客服的方言语音识别功能升级是重要的技术适老化突破,是在数字时代通过语言多样性和经济转化这两点作出的一次突破,对于从客户需求出发来说,方言识别能从人重新赋权于老年人上构建老年人对于数字的认同,唤醒老年人心中难舍的乡音,促成文化人群体更加坚定地站在自己一方土地之上,帮助化解掉由于不同语言带来的技术隔阂,让人文关怀拉近人与人之间的距离,为智能服务赋能为方言功能增添数字经济发展新动能。在技术层面上,深度学习与迁移学习的突破解决了方言识别精度和耗损的问题;在政策层面上,适老化改造专项行动、语言保护法是双向推动;在商业层面上,用户粘性、扩大区域市场则具有足够的增值空间。

参考文献

[1] 沈旭媛, 侯冠华, 雷子闲. 角色视角下的适老化设计理论演进[J]. 包装与设计, 2024(1): 128-129.
[2] 中国信息通信研究院. 数字技术适老化发展报告(2024) [EB/OL].
https://www.caict.ac.cn/kxyj/qwfb/bps/202412/t20241220_648564.htm, 2025-04-14.
[3] 汪颖, 黄利媛, 董春阳. 基于关怀理论的适老化产品设计研究[J]. 工业工程设计, 2023, 5(4): 73-82.
[4] 曹贤才, 张浩, 周博霖, 等. 影响老年人技术接受的因素——基于技术接受模型的元分析[J]. 心理发展与教育, 2025(6): 799-816.
[5] 杨丽娜. 方言的文化和社会功能[J]. 人民论坛, 2020(1): 138-139.
[6] 郭鸿宇, 王一诺. 方言调查、方言资源与国家语言治理[J]. 克拉玛依学刊, 2024, 14(1): 99-105.
[7] 厚鑫, 陈修远. 语言经济学视角下的中国方言经济研究[J]. 经济与管理评论, 2024, 40(3): 72-83.
[8] 听脑AI. AI语音识别如何攻克67种方言[EB/OL].
https://baijiahao.baidu.com/s?id=1826378922857256902, 2025-03-12.