AI方言数字人在适老化用药服务与濒危方言数字化保护中的应用探索
Application of AI Dialect Digital Humans in Elderly-Friendly Medication Services and Digital Preservation of Endangered Dialects
摘要: 我国已步入老龄化社会,老年人普遍用药需求较大,但其普通话水平往往限制了其对药品说明的正确理解,针对老年人方言用药难题,亦出于濒危方言保护需求,本研究将人工智能技术融入语言文化保护,提出创新性解决方法,借助打造具备方言交互功能的AI数字人,对老年人用药服务实施语言适老化优化,以用药服务作为关键应用场景,系统性地收集整理并保存濒危方言(以浙江淳安话为例)语料资源。技术路径上,依托开源语音技术框架,探索了面向医疗领域、低成本精简化的方言语音合成与识别模型开发方法,并设计了协同可持续的运营模式。通过技术赋能与场景创新,本研究不仅有助于提升健康服务的适老性与安全性,也为方言保护注入了可持续动力,实现了社会价值与文化意义的双重提升。
Abstract: China has entered an aging society, where the elderly generally have significant medication needs. However, their limited proficiency in Mandarin often hinders their correct understanding of medication instructions. To address the challenge of dialect-based medication communication for the elderly and to meet the need for preserving endangered dialects, this study integrates artificial intelligence technology into linguistic and cultural conservation, proposing an innovative solution. By developing AI digital humans with dialect interaction capabilities, the research aims to optimize language accessibility in medication services for the elderly. Using medication services as a key application scenario, it systematically collects, organizes, and preserves endangered dialect corpora (exemplified by Chun’an dialect in Zhejiang). Technically, the study employs open-source speech technology frameworks to explore low-cost, streamlined development pathways for dialect speech synthesis and recognition models, while designing collaborative and sustainable operational models. Through technological empowerment and scenario innovation, this approach not only enhances the accessibility and safety of health services for the elderly but also injects sustainable momentum into dialect preservation, achieving dual improvements in social value and cultural significance.
文章引用:周晓静, 楼凌玲, 高妍, 林丹丹, 王思懿, 邢焱玲. AI方言数字人在适老化用药服务与濒危方言数字化保护中的应用探索 [J]. 老龄化研究, 2026, 13(3): 470-476. https://doi.org/10.12677/ar.2026.133058

1. 引言

在数字化与老龄化并行的社会背景下,语言成为影响老年群体健康信息服务可及性的关键因素之一。以浙江省为例,超过60%的老年人日常主要使用方言进行交流。然而,现行医疗信息体系高度依赖普通话,导致老年人在理解用药信息时面临明显障碍,这不仅关系到医疗安全,更反映出当前适老化服务体系中语言包容性的结构性缺失。虽然近年来人工智能技术在方言识别与合成领域取得进展,但现有研究多集中于语音技术本身,尚未形成与社会实际需求的有效对接,所以探索如何利用技术手段在回应现实痛点的同时推动语言文化遗产的保护与传承,已成为一项兼具现实意义与创新价值的研究课题。

本研究以浙江地区的一种濒危方言——淳安话为例,尝试构建一个面向用药服务的AI方言数字人系统。本研究旨在为老龄化社会的语言包容性健康服务提供一个具体的技术应用案例,同时为非遗保护探索一种“技术赋能 + 场景驱动”的可持续模式。研究成果有望为其他面临类似语言服务困境与方言保护需求的地区,提供可参考的技术框架与实践经验。

2. 文献综述

在知网(CNKI)上用“药品适老化”为关键词检索,共获学术期刊41篇,硕士论文51篇,博士论文2篇。从发表时间分布看,最早文献可追溯至2017年,多数文献发表于2020年后,这表明针对老年人用药规范与服务的研究起步较晚,尚未得到广泛而深入的关注。对现有文献进行梳理后发现,国内研究主要从以下几个视角展开:

1. 用药安全视角下的药品包装设计研究。此类研究主要围绕药品包装设计要素展开,分析不同包装形式、材质、标识等对用药安全的影响[1],探讨如何通过优化包装设计降低用药错误率,提高患者用药安全性与依从性[2]

2. 适老化探究下的药品说明书阅读问题。此类研究聚焦老年群体,分析药品说明书在字体大小、语言表述、排版布局等方面对老年人阅读和理解造成的障碍[3],探索使药品说明书更易于老年人阅读和准确获取信息的改进策略[4]

3. 老年人用药不良预防的适用性分析。此类研究主要结合老年人的生理特点、用药习惯及常见疾病谱,评估现有药物治疗方案与用药指导模式等在预防老年人用药不良反应方面的适用性,进而提出针对性的预防措施和干预建议[5]

国外研究方面,通过百度学术检索“适老化研究”(aging-friendly research),相关文献较多侧重于智能养老与人口老龄化宏观议题。但直接针对“药品适老化”(medication aging-friendly)的国外研究文献仅检索到1篇相关综述[6]。这提示,通过药盒及说明书的智能化、适老化改造以辅助老年人安全用药,是一个有待深入探索并推广的领域,对于预防和降低用药不良事件具有重要意义。综合来看,当前研究在以下几个方面尚存空白或不足:

(1) 方言覆盖局限:现有研究多聚焦高频方言,未涵盖淳安话等濒危方言,导致偏远地区老年人服务缺失。建议采用迁移学习技术,补充濒危方言语料库,快速适配新语种。(2) 语音合成缺人情味:现有适老化设计多侧重药品包装,说明书视觉优化,缺乏智能性与感染力。拟通过AI数字人亲和形象解读用药信息,借鉴科大讯飞方言韵律建模技术,增强语音抑扬顿挫感[7]。(3) 文化保护不足:现有系统仅采集方言语音表层特征[8],流失用药相关文化隐喻。建议增加语境标注,同步记录使用者解释,构建“语音–文化”双模态数据库;联合短视频平台推出“方言用药挑战赛”,吸引年轻群体参与,强化文化延续性。

基于此,本研究以解决特定方言区(淳安话)老年人用药安全与服务适配问题为核心,将AI数字人技术与开源语音技术框架深度结合,推进适老化用药服务的智能化升级,同时实现对淳安话这一濒危方言的针对性数字化采集与保护。

3. 药品说明书适老化改造分析

3.1. 适老化改造必要性分析

3.1.1. 语言障碍与认知需求的双重挑战

在人口老龄化进程加速的背景下,语言习惯差异成为影响信息获取的关键因素。以浙江省淳安县为例,当地高龄老年人日常交流高度依赖淳安话。这种语言使用特征与以标准汉语书写的药品说明书之间,形成了切实的语言理解壁垒。浙江省药监局2022年统计数据(见表1)从侧面印证了本研究关注问题的现实紧迫性。

Table 1. Statistics on language and medication safety among the elderly in Zhejiang Province

1. 浙江老年语言与用药安全统计

信息类别

详情

地区

浙江省淳安县为代表区域

老龄化与语言状况

60岁以上人口中超过80%的老人日常以淳安话为主要交流语言

信息鸿沟

淳安话使用习惯与标准汉语药品说明书之间存在显著不对标

药监局数据

65岁以上老人因用药错误入院案例中,48.7%与“说明书理解障碍”相关

理解准确率

方言用药者对药品剂量理解准确率约为53.2%,普通话用药者约为82.1%

突出问题

慢性病多药联用等方案中,语言障碍导致的用药安全问题明显

WHO报告

发展中国家约30%用药错误源于信息传达障碍

从认知老化视角分析,老年人普遍存在的视力减退、短期记忆能力下降等生理变化,使得传统以密集文字为主的药品信息呈现模式,愈发难以适配其实际信息获取需求。初步对照试验数据显示,当药品核心说明信息通过淳安话语音形式呈现时(见图1),75岁以上受试者的信息记忆留存率提升约37%,用药依从性提高29个百分点(p < 0.01)。该结果初步表明,基于特定方言的语音交互方式,在改善老年群体用药困难、提升用药信息获取准确性方面具有独特应用价值。

Figure 1. Medication errors among the elderly

1. 老年人用药错误情况

3.1.2. 方言保护与文化传承的延伸价值

随着普通话的推广普及,如淳安话这类使用范围窄、传承链条脆弱的濒危方言,其生存空间正急剧萎缩。当前传统方言保护工作面临双重现实挑战:一方面是经济成本高企,专业人员开展实地调查的时均成本已超过500元;另一方面则是应用场景匮乏,导致保护机制缺乏可持续发展动力。这一背景下,探索方言在日常生活场景中的创新性应用,成为推进方言保护工作的重要突破口。

药品说明场景也为方言语料采集提供了兼具实用性与文化价值的独特切入点。医疗用语系统天然包含两类语料:(1) 基础用药词汇,如剂量表述“每日三次”、“饭后服用”等普适性表达;(2) 方言特异性表达,例如在淳安话中,某些中药或本地常见病可能存在特有的称谓或描述方式,甚至存在“有音无字”或借用普通话词汇发音但含义特定的现象。通过系统性采集这类医疗场景语料,不仅能够构建服务民生的实用方言数据库,更能同步保存医疗民俗中的文化基因与地方智慧。值得注意的是,业界如科大讯飞发起的“AI数字人方言保护计划”[9],已为本研究构想的技术实现路径提供了部分可资借鉴的参考。

3.2. 适老化改造可行性分析

3.2.1. 政策条件的支持

国际组织和我国政府已构建起支持语言资源保护的政策框架。联合国教科文组织通过的《保护非物质文化遗产公约》(2003)等文件为全球语言保护确立了基本准则。我国积极响应,教育部、国家语委于2015年启动“中国语言资源保护工程”,开创了国家层面系统性保护语言资源的先河,为包括方言在内的各类语言资源调查、采录与保存提供了强有力的政策与资源支持。

3.2.2. 技术条件的成熟

近年来,人工智能技术的飞速发展为方言的数字化保护与应用提供了日益成熟的技术条件。在数据基础方面,我国已初步建立起方言语音数据库的相关建设标准与规范[10],这为针对淳安话等具体方言的语料库建设提供了重要的技术参考。例如,北京语言大学等机构建设的“语保工程采录展示平台”,整合了全国大量调查点的实态语料,为研究提供了丰富的背景数据与比对资源[11]

在技术应用层面,语音识别与合成技术取得了显著进展。特别是针对混合语音识别、低资源方言建模等方向的技术探索[12],为本研究面向淳安话这类语料相对稀缺的濒危方言进行模型开发,提供了可行的技术思路。例如,“星辰超多方言语音识别大模型”已尝试解决方言自由混说识别问题,并在部分政务热线中成功应用,提升了方言区民众获取服务的便利性[13]

4. 药品说明书适老化改造路径探析

随着人口老龄化进程加快,老年群体的用药安全已然成为公共卫生领域的关键议题之一[14]。本研究以促进健康老龄化为理论关切,紧密追踪人工智能技术前沿,采用定量与定性相结合的混合研究方法[15],深入剖析老年人群体,在日常用药中面临的实际困境。在此基础上,创新性地提出“技术赋能、服务重构、文化适应”三位一体的适老化改造方案。该方案不仅关注信息呈现形式的适老优化,更强调通过深度适配淳安话的语言特性来提升用药指导的准确性与接受度,旨在为智慧健康服务提供兼具实用价值与文化保护意义的实践范例。

4.1. 技术实现路径的系统构建

本研究设计了一套系统的实施方案,将淳安话保护与用药适老化服务深度融合。方案采用“三步走”的实施路径,确保项目的科学性和可持续性。

第一阶段,基础语料库建设与平台搭建。组建跨学科团队,涵盖方言学(特别邀请淳安话研究者)、药学、计算机科学等领域专家。核心工作包括:(1) 制定淳安话医疗语料采集规范:明确采录音频质量、文本转写规则、语境信息标注(如说话人年龄、用药场景)等标准。(2) 构建淳安话用药初始语料库:采集内容包括基础用药词汇与短语的淳安话标准读法;常见药品说明书核心内容的淳安话口语化表述;针对淳安话中医疗相关“有音无字”词或特殊借音词,进行语音录制与语义注释;模拟用药咨询的对话语料。邀请多位淳安话发音人(兼顾年龄、性别代表性)参与录制。(3) 搭建基础技术平台:基于开源框架(如Kaldi,ESPnet或PyTorch)初始化开发环境,集成基础语音识别(ASR)与语音合成(TTS)模块。

第二阶段,核心AI模型开发与系统集成。本阶段聚焦于关键AI模型的构建与优化(见图2):(1) 方言语音识别(ASR)模型:采用预训练–微调(Pre-training & Fine-tuning)策略。首先,选用在大量普通话及多方言数据上预训练好的开源语音识别模型(如Wenet、Whisper的多语言版本)作为基础模型。然后,使用第一阶段构建的淳安话用药语料库对该基础模型进行有监督的微调。微调过程中,重点处理淳安话的连续变调、特殊韵母及与普通话差异显著的声母,通过数据增强(如添加噪声、改变语速)提升模型鲁棒性。(2) 方言语音合成(TTS)模型:采用端到端的神经语音合成技术(如VITS、FastSpeech2)。首先训练一个基础的普通话TTS模型,然后利用淳安话发音人的语音数据对该模型进行自适应训练(Adaptation)。(3) 对话管理与知识图谱:构建一个轻量级的医疗用药知识图谱,包含药品属性、用法用量、禁忌等结构化信息。开发对话管理模块,将ASR识别出的淳安话查询意图映射到知识图谱,并组织TTS模块生成淳安话语音回复。(4) AI数字人形象与交互:设计一个亲和力强的老年友好型数字人形象,并开发简单的唇形同步与表情驱动功能,使其播报语音时更具表现力。

Figure 2. Schematic diagram of the architecture for a medication assistance system based on AI dialect digital humans

2. 基于AI方言数字人的用药辅助系统架构示意图

第三阶段,试点应用与持续迭代。选择淳安县内1~2个典型社区或养老机构作为试点,收集老年用户及医护人员关于方言识别准确率、语音合成自然度、系统易用性等方面的反馈。基于反馈数据,对ASR和TTS模型进行迭代优化,特别是在处理用户口语化、非标准的淳安话表达方面。建立“使用即采集”的机制,在用户授权前提下,匿名收集实际交互中产生的新的、自然的淳安话语料,持续扩充和更新语料库,实现方言的活态保护与技术模型的共同进化。

4.2. 内容优化与服务创新实践

在内容层面,对药品信息进行分级分类与方言适配重构。将说明书内容划分为“关键用药信息”(用法、用量、频次)、“重要注意事项”(禁忌、不良反应)、“扩展知识”(药理、储存)三个层级。关键信息采用最地道的淳安话口语进行简洁、重复性播报;对于注意事项中的专业术语,探索用淳安话中已有的通俗概念进行比喻或解释,谨慎处理“无词对应”情况,必要时采用“借音释义”策略。

服务模式上,开发了几大核心功能场景。第一,药品识别功能能借助计算机视觉技术实现药品信息的快速查询。第二,用药咨询可以提供全天候的语音问答服务,及时解答老年人群体的各类用药疑问。第三,通过精细化的微表情控制系统开发,AI数字人能够实现更具人性化的交互体验。

4.3. 实施路径与保障体系建设

为确保方案落地,需建立多方协同的保障体系(见图3)。政府相关部门可在政策指导、试点协调方面提供支持;高校与研究机构提供专业指导与人才支撑;本地社区与医疗机构是重要的试点合作方与需求反馈来源;技术企业可提供部分开源工具支持或商业化合作可能性。通过“政–产–学–研–用”协同,共同推进项目的实施与优化。

Figure 3. Schematic diagram of the multi-party collaborative safeguard mechanism for project implementation

3. 项目实施的多方协同保障机制示意图

4.4. 预期成效与社会价值评估

本研究实施后,预期会在社会效益和健康成果两方面产生积极且深远的影响,从直接效果来看,有望显著降低淳安话老年使用者的用药错误风险,提升其用药依从性与自我健康管理能力。在文化保护方面,构建一个持续增长的、高质量的淳安话医疗场景专用语音数据库[16],为这一濒危方言的数字化保存提供核心资源,预计在试点期内可采集有效高质语料数十小时。

更深层次的社会价值体现在多个维度。在个体层面,有助于增强老年人自我健康管理能力,提升生活质量;在家庭层面,促进代际数字鸿沟的弥合,改善家庭照护质量;在社会层面,推动医疗服务模式创新,完善老年健康服务体系;在经济层面,培育新型养老服务业态,助力银发经济发展。

5. 结论

本研究聚焦老龄化社会中的用药安全语言障碍与濒危方言保护双重议题,以浙江淳安话为具体研究对象,提出以AI方言数字人为核心的创新解决思路。通过构建具备淳安话交互能力的智能用药辅助系统,旨在直接改善方言老年用户的用药信息获取体验,并以用药服务这一高频场景为切入点,系统性地采集、保存和活化淳安话语料。

研究依托开源语音技术框架研发轻量化方言语音合成及识别模型,形成可复制的技术路径。显著提升了老年人用药安全水准,又能为濒危方言提供低成本高参与度的保护新范式,兼具社会价值与文化意义。未来可进一步拓展技术应用场景,推动跨区域推广,助力实现技术创新与文化传承双向赋能。

基金项目

项目级别:大学生创新创业计划训练项目国家级立项,项目名称:“语”药同行:AI方言数字人在适老化用药服务与濒危方言数字化保护中的应用探索,项目编号:2025127920050。

参考文献

[1] 李珍, 杨静. 包容性设计视角下老年群体药品包装设计策略研究[J]. 绿色包装, 2024(12): 70-74.
[2] 杨微. 基于用户共情理论的老龄药品包装设计研究[D]: [硕士学位论文]. 岳阳: 湖南理工学院, 2024.
[3] 周博雅, 赵志刚, 陆浩, 武明芬, 李茜茜, 等. 老年慢性病治疗药物中美药品说明书适老化信息对比分析[J]. 医药导报, 2024, 43(12): 1936-1943.
[4] 鲁秀玲, 闫阔, 樊栓成, 赵志刚. 北京地区737例老年患者药品说明书阅读问题调研及适老化探讨[J]. 中南药学, 2024(11): 2976-2981.
[5] 李少强, 孔旭东, 张倩, 李沭, 等. 全面触发工具法在成人及老年患者药品不良事件预警中的临床应用适用性分析[J]. 中国医院用药评价与分析, 2023, 23(11): 4-6.
[6] 张伊楠, 李新辰, 武明芬, 李鹤, 等. 欧美药品适老化体系研究及对我国的启示[J]. 中国食品药品监管, 2024(9): 104-111.
[7] 马若云. 健康传播视角下药品说明文本的易读性测量与适老化改造研究[D]: [硕士学位论文]. 西安: 西安外国语大学, 2024.
[8] 杨迪一. 基于深度学习的陕北方言语音识别系统设计[D]: [硕士学位论文]. 延安: 延安大学, 2023.
[9] 俞玮奇. 国民普通话能力的基本状况与发展态势[J]. 语言文字应用, 2018(2): 99-107.
[10] 通拉嘎. 方言数据库建设与研究现状评述[J]. 建图书馆学刊, 2020(1): 4-6.
[11] 通拉嘎. 闽南方言专家数据库建设研究[J]. 泉州师范学院学报, 2019, 37(3): 84-88.
[12] 张爽, 翟文东. 方言语音数据库建设标准研究[J]. 网络安全技术与应用, 2023(2): 56-57.
[13] Wang, B. (n.d.) Open Data Lab.
https://opendatalab.com/
[14] Feng, Y. (2024) Protecting Dialects with AI: The First Speech Large Model Supporting Mixed Speech of 30 Dialects Is Released. Southeast Net.
https://www.fjsen.com/zhuanti/2024-05/25/content_31650698.htm
[15] 曹志耘. 论浙江方言文化的保护传承[J]. 浙江社会科学, 2021(2): 118-124+159.
[16] 国家卫生健康委员会等十五部门. “十四五”健康老龄化规划[EB/OL]. 中国政府网.
http://www.gov.cn/zhengce/zhengceku/2022-03/01/content_5676340.htm, 2026-01-24.