抑郁倾向大学生中式曼陀罗绘画心理自助疗愈平台的设计研究
A Design Study on a Psychological Self-Help Therapy Platform for Chinese Mandala Painting for College Students with Depressive Tendencies
摘要: 当前,我国大学生抑郁风险检出率较高,但传统心理健康服务面临资源失衡、文化适配性不足等挑战。针对此问题,本研究以抑郁倾向大学生为核心用户群体,融合中式曼陀罗绘画与中医五音疗愈理论,设计了一款数字化心理自助疗愈平台。评估模块采用ZUNG氏抑郁自评量表(SDS)进行动态筛查;涂色模块结合中式纹样曼陀罗模板与语音引导,促进情绪表达;音乐模块基于五音疗法(宫、商、角、徵、羽)实现与用户心理状态的智能匹配;分析模块通过颜色、结构、意象三元分析及原型大圆理论生成个性化心理报告。平台设计主要采用Vue与SpringBoot技术栈开发,整合多模态情绪分析模型,实现绘画行为与音乐交互数据的实时反馈,为高校心理健康服务的数字化转型提供了可复用的技术范式。
Abstract: Currently, college students in China present a relatively high detection rate of depression risk, while traditional mental health services are challenged by unbalanced resource allocation and insufficient cultural adaptation. To address these issues, this study takes college students with depressive tendencies as the core user group, and develops a digital self-help psychological healing platform by integrating Chinese-style mandala painting and traditional Chinese medicine five-tone therapy theory. The assessment module adopts the Zung Self-Rating Depression Scale (SDS) for dynamic screening; the coloring module combines Chinese-pattern mandala templates with voice guidance to facilitate emotional expression; the music module enables intelligent matching with users’ psychological states based on the five-tone system (Gong, Shang, Jiao, Zhi, Yu); the analysis module generates personalized psychological reports through a ternary analysis of color, structure and imagery, as well as the prototype mandala theory. Developed with the Vue and SpringBoot tech stack, the platform integrates a multimodal emotion analysis model to realize real-time feedback of painting behavior and music interaction data, providing a reusable technical paradigm for the digital transformation of mental health services in universities.
文章引用:黄星雨, 傅浙燚, 黄子翎, 汤小琪, 刘一臣, 毛家乐, 刘敏. 抑郁倾向大学生中式曼陀罗绘画心理自助疗愈平台的设计研究[J]. 护理学, 2026, 15(3): 230-246. https://doi.org/10.12677/ns.2026.153089

1. 引言

青少年是抑郁高发敏感群体,大学生处于青少年向成年过渡的关键期,其抑郁问题频发且易发展为成年期抑郁,心理健康亟待关注。《2022年大学生心理健康状况调查报告》显示[1],我国大学生抑郁风险检出率达21.48%,焦虑问题亦较普遍。受医疗资源不均、病耻感等影响,自助式疗愈成为重要干预方式。数字疗法利用数字设备进行疾病评估和干预[2],目前已证实其对多种精神障碍具有良好疗效,为本平台的数字化定位提供了理论依据。多模态情感计算作为人工智能的重要分支,通过融合图像、行为、语音或文本等多源信息,对个体情绪进行综合建模,被认为在复杂情绪识别与心理健康监测中具有较高应用潜力[3]。而艺术心理干预的数字化场景中,绘画行为除视觉结果外,还包含操作节奏、颜色选择、结构表达等动态特征,这些多维数据为多模态情绪识别提供了重要支撑,且已有研究证实,结合深度学习的多模态融合模型能有效提升情绪识别精度,在抑郁筛查、压力评估等领域成效显著[4]。曼陀罗绘画疗愈效果显著,但传统纸质产品存在诸多局限,难以适配需求。为此,本研究融入中国传统文化,构建中式曼陀罗绘画疗愈平台,依托数字化技术破解局限,为大学生抑郁自助疗愈提供新路径。

2. 抑郁倾向大学生用户画像与用户旅程图

本研究以浙江省某高校具有抑郁倾向的大学生群体为研究对象,通过访谈与观察法开展调研。在数据收集基础上,采用用户画像构建方法,通过对调研对象的人口学特征、抑郁程度、市面上心理疗愈平台态度等,多维度数据进行聚类分析与典型特征提取,最终归纳出三类核心用户画像(图1)。

Figure 1. User profile

1. 用户画像图

在大学生中开展曼陀罗纸质绘本体验活动,结合学生从开始绘画到结束绘画的全流程,绘制用户旅程图,识别各阶段情绪体验、平台开发痛点与优化机会点(图2)。

Figure 2. User journey map

2. 用户旅程图

根据调查结果,针对抑郁倾向大学生群体,本次项目设计将以中式曼陀罗绘画为核心载体,确立“文化适配型、数字化、普惠性、闭环式”定位,构建五大设计原则:用户中心原则适配心理特征与操作习惯,简化交互流程;文化适配原则融合中式纹样(云纹/回纹)与五音疗愈(宫商角徵羽对应五脏),强化文化认同;科学疗愈原则基于荣格自性理论及曼陀罗框架,结合用户调研校准功能逻辑;隐私保护原则通过匿名化与数据加密构建信任机制;操作便捷原则采用极简流程,降低使用门槛,形成兼具传统底蕴与科技赋能的心理自助工具。

3. 中式曼陀罗绘画心理自助疗愈平台的整体设计

中式曼陀罗绘画心理自助疗愈平台以“中式曼陀罗绘画”为核心载体,“中医五音疗愈”为辅助手段,“多模态智能分析”为反馈支撑,构建“评估–涂色–音乐–分析–反馈”闭环疗愈体系。平台核心功能模块包括评估模块、涂色模块、音乐模块、分析模块。

3.1. 评估模块功能概述

评估工具选择《ZUNG氏抑郁自评量表》(SDS) [5],由William W.K. Zung教授于1965年编制,由葛红敏[6]进行抑郁筛查的可行性研究,适用于14岁及以上的人群。该量表包含了20道题目,涵盖着情绪、认知、行为等多个维度,能够全面评估用户的抑郁倾向。

用户登录后经系统引导了解测试要求,按近一周实际感受完成20道四选项题目,系统实时计分并自动换算标准分,生成包含抑郁程度与风险等级的评估报告,为后续疗愈环节提供数据支撑。当用户超过14天未登入平台时,需重新弹出评估模块,提醒用户再次填写SDS,更新用户心理状态。若用户在14天内再次主动使用平台,系统将不再强制弹出量表,避免过度测试所带来的心理负担;若用户连续使用平台超过30天,系统将结合使用频次与绘画行为特征,综合判断是否建议用户重新开展评估,确保评估的科学性与人性化。

3.2. 涂色模块功能概述

曼陀罗绘画图库——参考鲁艳桦研究团队开发的大学生抑郁曼陀罗绘画自助干预绘本图库[7]设计理念,在公开的免费曼陀罗(Mandala)图案的资源网站,如Pixabay、Freepik、Openclipart、Rawpixel、Vecteezy等,根据具体授权条款,进行资源署名、双重确认授权或者公共领域自由使用等操作,建立可用于网站开发的中式曼陀罗自助式疗愈图库。

选图需为结构式曼陀罗,结合中国传统文化元素,具备对称、重复特征且复杂度适中,优先选莲花、菊花、龙纹等有文化意义的纹样,助力情绪激活与转化;模板设计注重对称趋中,借规律性助绘画者内化稳定性、增强安全感。平台计划配备含32种颜色的圆形色轮,支持饱和度、透明度微调及常用颜色收藏;涂色界面可实时保存创作进度,同时实现撤销、重做功能,并在绘画前后设置语音指导,引导用户自由表达情绪。在安全的创作环境中,绘画者能借助色彩和线条宣泄内心积压的情绪,而曼陀罗大圆的边界限制,能让情绪表达更有节制,避免心理能量涣散,当内心情结得到弱化与化解,自性的凝聚动力便可引导心理能量顺畅指向自我。

3.3. 音乐模块功能概述

已有研究证明[8],中医五音疗法对抑郁倾向的人可产生积极影响,可以作为抑郁倾向治疗的辅助手段,基于此平台构建中医五音疗愈曲库。中医五音疗法相关理论来源于《黄帝内经》[9],依据“五音对应五脏”理论,宫调属土对应脾、商调属金对应肺、角调属木对应肝、徵调属火对应心、羽调属水对应肾,选取各调式经典传统曲目,如宫调《梅花三弄》、徵调《紫竹调》、羽调《二泉映月》等。

为确保版权合规,团队将通过音乐授权平台曲多多(AGM)获取中医五音疗愈曲版权,确保平台音乐的合法使用;同时整合公开免费无版权音乐平台的合规资源,严格遵循许可协议,进行资源署名,或二次验证授权状态,曲库搭建严格遵循版权规范,通过授权平台与免费合规资源整合获取曲目,并利用音乐分析软件验证各音阶频率特性,确保疗愈效果。

在音乐模块设计中,平台建立了基于中医五音疗愈的智能推荐系统。该系统基于SDS评分采用五级分层推荐策略(详见表1),避免7天内重复推荐同一首音乐,防止听觉疲劳。提供音量调节(默认40~60 db,安神类曲目默认30~45 db)、播放模式(单曲循环、顺序播放、随机播放)、定时关闭(15/30/60分钟可选)功能。

Table 1. Matching table of SDS depression grading and five-tone therapy music

1. SDS抑郁分级与五音疗法音乐匹配表

SDS标准分

抑郁程度

推荐音乐调式

核心作用

代表曲目

推荐时长

主要结论(数据支撑)

50-59分

轻度抑郁

宫调式 + 角调式

健脾疏肝 稳定情绪

《紫竹调》 《胡笳十八拍》

30~45分钟

宫调式组焦虑量表(SAS)评分下 降12.3分(P = 0.011),角调式组睡 眠质量提高28% (P = 0.008)

60-69分

中度抑郁

角调式 + 徵调式

疏肝健脾 提升活力

《阳春白雪》 《步步高》

45~60分钟

角徵组合干预后HAMD量表减 分率18.6% (对照组仅7.2%,P = 0, 003)

≥70分

重度抑郁

羽调式 + 宫调式

滋肾安神 强化安全感

《梅花三弄》 《霓赏曲》

60~90分钟

羽宫组合使重度抑郁患者自杀意念 发生率从38%降至22% (P = 0.012),HRSD量表减分24.7分

3.4. 分析模块功能概述

结合孟沛欣[10]等人研究的绘画评定指标形成分析模块核心架构,即颜色分析系统、结构分析系统、意象分析系统。该三元分析方法能够从视觉表现层面提取与抑郁风险相关的绘画特征,为心理状态评估提供基础依据。在此基础上,为提升分析结果的客观性与智能化水平,系统进一步引入人工智能与多模态情感计算技术,对绘画图像特征进行自动提取与综合分析。多模态情感计算能够融合视觉内容特征与行为数据,实现对个体情绪状态的综合建模,已在心理健康监测与情绪识别领域得到广泛应用[3]

3.4.1. 分析模块核心架构

分析模块主要分为两个部分,一是颜色/结构/意象三元分析,二是原型大圆理论十二阶段理论。

3.4.2. 颜色/结构/意象三元分析

颜色/结构/意象三元分析,均采用了鲁艳桦编著的《大学生抑郁风险特征及曼陀罗绘画自助干预研究》[7]中设计的曼陀罗绘画特征评定法,包括颜色分析系统(颜色种类、特定颜色使用、补色使用、冷暖色、色彩调和程度)、结构分析系统(线条浓淡、其他形状、涂色留白空间)、意象分析系统(包括意象及意象类型)。

上述特征可通过人工智能图像处理算法进行自动提取,其中,颜色特征基于颜色空间统计方法进行量化分析,结构特征通过边缘检测与形态学分析获取,意象特征则结合目标识别与语义分类模型进行识别。该方法与多模态艺术情绪识别研究中基于视觉特征进行心理状态建模的技术路径一致,能够有效提高评估的客观性与一致性[11]

3.4.3. 原型大圆理论十二阶段理论

Kellogg是一位曼陀罗作品的艺术心理治疗师,根据荣格对自我与自性原型的关系理论,提出了曼陀罗之原型大圆理论[12],该理论认为曼陀罗作品可作为区分个体意识发展水平的有效工具,尽管存在个体差异,但其发展轨迹均可归纳为十二个阶段,以空无期、喜悦期、迷宫期、开端期、目标期、矛盾期、方圆期、自我期、结晶期、死亡期、分裂期、狂喜期为核心框架,从形状结构、色彩特征、自我与自性的关系、心理状态及核心任务五个维度,构建了一套可操作的评估体系,同时可弥补三元分析的不足,通过颜色、形状结构,进一步分析自我与自性的关系、心理、该阶段的主要任务。

本研究在三元分析结果基础上,通过规则匹配与特征组合分析,将绘画特征映射至相应发展阶段,从形状结构、色彩特征、自我与自性关系、心理状态及阶段任务五个维度生成解释结果。该过程属于多模态情感计算中的高层语义推断环节,即在低层视觉特征基础上实现心理意义解释,从而增强系统的可解释性与临床参考价值[13]。同时,阶段性结果将作为数字疗法中的反馈依据,通过周期性记录与变化趋势分析,为用户提供连续的心理成长轨迹与干预建议,实现评估与干预一体化的数字心理支持模式。

4. 平台视觉与交互设计

4.1. 界面视觉设计

界面设计围绕“自然疗愈”主题,融合中医五行理论与中式曼陀罗艺术美学,采用导航区–核心功能区–内容呈现区的简洁结构,遵循舒缓性、文化性、功能性三大原则。通过低饱和色彩、柔和线条降低视觉压力,适配抑郁情绪干预场景;植入水墨画、云纹等中式视觉元素,强化文化共鸣;以模块化设计实现内容层次分明,确保用户操作路径直观,打造兼具人文底蕴与现代科技感的交互界面(详见图3)。

Figure 3. Login page visual design

3. 登录页面视觉设计

4.2. 交互设计

用户点击图标进入涂色页面,呈现曼陀罗的图案与色盘。色盘采用原型设计,对应色彩心理学分类。用户涂色时,图案可轻微动态反馈,增强互动感。涂色完成可匿名保存、分享作品或提交分析(详见图4)。

Figure 4. Interaction design

4. 交互设计

5. 平台技术架构设计

5.1. 开发技术栈

1) 前端:选用Vue框架,以HTML、CSS、JavaScript为基础,凭借响应式系统与组件化架构,实现直观、高效的用户界面开发,支持简单页面增强与复杂单页应用构建,确保前端交互的流畅性与可维护性。

2) 后端:采用SpringBoot框架,通过开箱即用、内嵌式服务器、完善的starter依赖体系,大幅简化Spring应用的创建与部署,让开发者专注于业务逻辑实现,提升开发效率与系统运行效能,适配平台的功能开发与后续拓展。

3) 数据库:使用MySQL开源关系型数据库,以先进的表关联架构、外键约束与多表联查机制实现数据的结构化存储,保障用户信息、SDS量表数据、绘画作品、音乐播放记录等数据的管理效率与安全性,提升数据操作的灵活性。

5.2. 核心功能实现

5.2.1. 基于绘画的多模态情绪分析模型构建

1) 数据构建和预处理:为实现对用户情绪状态的多维度刻画,研究设计可围绕曼陀罗绘画过程构建多模态情绪分析数据集,通过统一交互流程同步采集图像信息、行为轨迹数据及心理量表数据,并对多源数据进行标准化处理,以保证模型训练的稳定性与可比性。

在视觉模态方面,用户完成涂色后系统自动生成曼陀罗作品图像,记为:

I R H×W×3

其中H与W分别表示图像尺寸,3为RGB颜色通道。为保证模型输入的一致性,首先对原始图像进行尺寸归一化处理:

I =Resize( I,224×224 )

随后对像素值进行标准化:

I norm = I μ σ

其中 μ σ 为训练集统计得到的均值与标准差。为提高模型对不同绘画风格与设备差异的适应能力,在训练阶段对图像进行随机旋转、尺度变化及亮度扰动等数据增强操作,记为 I avg =T( I norm ) ,从而增强样本分布的多样性并降低过拟合风险。

在行为模态方面,系统在用户绘画过程中实时记录操作轨迹信息,构建时序行为序列:

S={ s 1 , s 2 ,, s T }

其中每个时间步向量表示为:

s t =[ x t , y t , v t ,Δ t t , c t ]

分别对应绘画位置坐标、笔触移动速度、停顿时间以及颜色编码等特征。考虑到不同用户绘画时长存在差异,为满足时序模型输入要求,设定统一序列长度为 L ,当 T<L 时采用零填充,当 T>L 时进行截断处理。随后对行为特征进行Min-Max归一化:

s t norm = s t s min s max s min

该处理能够消除量纲差异,使序列特征更加稳定地反映用户绘画节奏与行为波动特征。

在心理状态标注方面,本研究采用ZUNG抑郁自评量表(SDS)作为主要情绪评价依据。设量表原始得分为:

SDS= R 80 ×100

并依据标准分划分抑郁风险等级:

y cls ={ 0,SDS<50 1,50SDS<60 2,SDS60

其中 y cls 表示分类标签,而连续的SDS值作为回归目标。该双标签设计能够同时支持情绪等级判别与心理状态强度预测,从而构建多任务学习框架。

在多模态数据整合阶段,以用户单次完整使用流程为基本样本单位,构建统一数据结构:

D i ={ I i , S i , Y i }

其中 Y i ={ y cls ,SDS } 。最终形成多模态数据集: D={ D 1 , D 2 ,, D n } ,并按照8:1:1比例划分为训练集、验证集与测试集,以保证模型评估结果的客观性与稳定性。

通过上述流程,构建了包含视觉信息、行为动态特征与心理评估结果的多模态情绪分析数据体系,为后续卷积特征提取、时序建模及跨模态融合提供可靠的数据基础。

2) 特征提取方法:在完成多模态数据构建与预处理后,本研究分别从视觉模态与行为模态中提取能够表征用户情绪状态的深层特征。其中,视觉特征主要用于刻画颜色分布与结构复杂度等静态信息,行为特征用于反映绘画过程中的动态心理变化,二者共同构成情绪识别的重要依据。

在基于卷积神经网络的视觉特征提取上,对于预处理后的曼陀罗图像 I norm ,采用卷积神经网络(CNN)进行层级特征学习。卷积层通过局部感受野对图像进行特征映射,其计算过程可表示为:

X ( l ) =σ( W ( l ) X ( l1 ) + b ( l ) )

其中, X ( l ) 表示第III层特征图, W ( l ) X ( l1 ) 分别为卷积核参数与偏置项,*表示卷积运算, σ( · ) 为ReLU激活函数。

随着网络层数加深,模型能够逐步提取从低层纹理特征到高层语义结构特征的信息,包括线条密度、对称程度与整体构图复杂度等心理相关视觉模式。本研究选用轻量级ResNet结构作为主干网络,并通过全局平均池化(Global Average Pooling)将最终特征图映射为固定长度向量:

f cnn R d v

其中 d v =512 。该向量作为图像的深层语义表示,用于后续多模态融合。

在颜色心理统计特征提取上,颜色使用情况在心理绘画分析中具有重要意义。为增强模型对情绪表达的解释能力,本研究进一步从图像中提取颜色统计特征。

设图像中第 i 个像素的颜色为 p i ,图像总像素数为 N ,则第 k 类颜色的使用比例定义为:

h k = 1 N i=1 N 1( p i C k )

其中 1( ) 为指示函数, C k 表示预设的颜色区间类别。基于颜色心理学,将颜色划分为暖色系与冷色系,并计算暖色比例:

r warm = N warm N

同时计算颜色多样性指标,以颜色种类数量表示:

n color =| { C k : h k >τ } |

其中, τ 为最小占比阈值。

最终颜色统计特征表示为:

f color =[ h 1 , h 2 ,, h k , r warm , n color ]

该特征能够反映情绪倾向,如暖色比例较高通常对应积极情绪,而单一颜色使用可能与情绪抑制相关。

为综合利用深层语义特征与可解释的颜色心理特征,将二者进行拼接,得到最终视觉表示:

f v =[ f cnn ; f color ]

其中 f v R d ,作为视觉模态输入特征。

在行为时序特征提取上,对于用户绘画行为序列 S ={ s 1 ,, s l } ,采用循环神经网络进行动态特征建模。其隐藏状态更新过程可表示为:

h t =tanh( W s s t + U h h t1 +b )

其中 h t 表示时刻 t 的隐藏状态。序列末端隐藏状态作为行为整体特征:

f b = h L R d b

该特征能够反映绘画节奏稳定性、停顿波动程度及操作连贯性等心理行为模式。

为消除不同模态特征尺度差异,对各模态向量进行线性映射至统一维度:

f v ˜ = W v f v f b ˜ = W b f b

得到统一表示后,将用于后续的跨模态融合与情绪预测。

通过上述特征提取方法,实现了对用户绘画作品中颜色表达、结构特征及行为动态信息的综合建模,为情绪状态识别提供多层次特征基础。

3) 基于Transformer的多模态融合方法需要对不同模态信息进行统一建模,以充分挖掘各模态之间的关联关系。传统的特征拼接方法难以有效刻画模态间的交互依赖,而自注意力机制能够动态学习不同模态对情绪预测的重要性。因此,本研究采用Transformer编码结构实现多模态特征的深度融合。

首先,对各模态特征进行统一维度映射。设视觉特征与行为特征分别为 f b ˜ R d f v ˜ R d ,同时将心理量表信息(如SDS标准分)通过全连接层映射为同维度表示:

f s ˜ = W s SDS+ b s ,       f s ˜ R d

随后将三种模态特征按序组合为模态序列表示:

Z=[ f v ˜ ; f b ˜ ; f s ˜ ] R 3×d

该表示将不同信息源视为“模态token”,输入Transformer编码器进行交互建模。

在自注意力计算过程中,首先通过线性变换生成查询、键和值矩阵:

Q=Z W Q ,   K=Z W K ,   V=Z W V

其中 W Q , W K , W V R d×d ,为可学习参数。随后计算模态之间的注意力权重:

Attention( Z )=softmax( Q K T d )V

该过程能够根据特征相关性自动调整不同模态的贡献权重。例如,当颜色特征变化显著时,视觉模态权重将被提升;而当绘画行为波动较大时,行为模态的影响将相应增强。

为了进一步提升模型表达能力,本研究采用多头注意力机制,将特征映射到多个子空间进行并行学习:

MultiHead( Z )=Concat( hea d 1 ,,hea d h ) W o

其中 h 为注意力头数, W o 为输出映射矩阵。多头机制能够从不同角度捕捉模态间的潜在关系,提高融合特征的稳定性与鲁棒性。

经过注意力计算后,融合特征通过前馈网络进行非线性变换:

F=FFN( Z )=max( 0,Z W 1 + b 1 ) W 2 + b 2

并结合残差连接与层归一化操作:

Z out =LayerNorm( Z+F )

最终,将编码后的模态表示进行全局聚合(平均池化)得到统一融合向量:

f fusion =Mean( Z out ) R d

该向量综合表征了用户在视觉表达、行为动态及心理评估三个层面的信息,将作为后续情绪分类与SDS回归预测的输入特征。

在模型实现中,Transformer编码器设置为1层结构,注意力头数为4,隐藏维度为256,以在保证融合效果的同时控制模型复杂度,适用于本研究的应用场景与数据规模。

通过上述方法,实现了多模态信息的动态权重分配与深层语义交互,相较于简单拼接方式能够更有效地捕捉绘画行为与心理状态之间的复杂关联关系,提高情绪识别结果的准确性与稳定性。

4) 模型训练与损失函数在获得多模态融合特征 f fusion 后,设计研究可采用多任务学习框架对用户情绪状态进行联合预测,包括抑郁风险等级分类任务与SDS标准分回归任务。多任务学习能够在共享特征表示的基础上同时优化离散情绪类别判别与连续心理状态估计,从而提高模型对用户心理特征的综合表达能力。

首先,将融合特征输入全连接层进行非线性映射,得到情绪分类预测结果:

y ^ =softmax( W c f fusion + b c )

其中 y ^ 为各抑郁等级的预测概率分布, W c b c 为分类层参数。设真实标签为独热编码形式 y ,则分类任务的损失函数采用交叉熵损失:

L cls = i=1 C y i log( y ^ i )

其中 C 为类别数。本研究根据SDS标准分将样本划分为正常、轻度风险与中重度风险三类。

在回归任务中,融合特征通过另一全连接层预测用户的SDS标准分:

s ^ = W r f fusion + b r

设真实标准分为 s ,则回归损失采用均方误差(Mean Squared Error, MSE):

L reg = 1 N j=1 N ( s j s j ^ ) 2

其中 N 为批量样本数。该损失能够约束模型学习心理状态的连续变化趋势,使预测结果更加精细。

为同时优化两项任务,本研究构建联合损失函数:

L=α L cls +β L reg

其中 α β 为权重系数,用于平衡分类与回归任务的重要性。根据实验经验设置 α=0.6 β=0.4 ,以保证风险等级判别准确性的同时兼顾心理状态强度预测。

在模型训练过程中,采用Adam优化算法进行参数更新,其更新规则为:

θ t+1 = θ t η m t ^ v t ^ +ε

其中 η 为学习率, m t ^ v t ^ 分别为一阶与二阶矩估计。本研究设置初始学习率为 1× 10 4 ,批量大小为32,训练轮数为50,并在验证集上监控损失变化,当验证误差不再下降时提前停止训练,以防止过拟合。

通过上述多任务训练策略,模型能够在共享多模态特征表示的基础上同时学习情绪分类边界与心理状态连续变化规律,从而提升整体预测性能与结果稳定性。

5) 模型评价指标与结果验证:为全面评估多模态情绪分析模型的预测性能,本研究分别从分类任务与回归任务两个层面进行量化评价,并结合心理专家人工评估结果进行外部验证,以提高模型结果的可靠性与应用价值。

在抑郁风险等级分类任务中,首先采用分类准确率(Accuracy)作为整体性能指标,其定义为:

Accuracy= TP+TN TP+TN+FP+FN

其中, TP (True Positive)表示正确预测为阳性的样本数, TN (True Negative)表示正确预测为阴性的样本数, FP FN 分别表示误判为阳性和漏判的样本数。该指标能够反映模型对总体样本的判别能力。

考虑到不同风险等级样本分布可能存在不均衡问题,本研究进一步采用精确率(Precision)与召回率(Recall)计算F1-score,以综合评价模型在各类别上的识别效果。其中:

Precision= TP TP+FP Recall= TP TP+FN

F1-score定义为精确率与召回率的调和平均:

F 1 =2× Precision×Recall Precision+Recall

该指标能够在保证预测准确性的同时兼顾漏检与误检情况,更适用于心理风险识别场景。在SDS标准分预测任务中,采用均方误差(Mean Squared Error, MSE)评价模型对心理状态连续值的拟合能力,其计算公式为:

MSE= 1 N i=1 N ( s i s i ^ ) 2

其中 s i 为真实SDS标准分, s i ^ 为模型预测值, N 为样本数量。MSE越小,说明模型对用户心理状态变化趋势的刻画越准确。

除量化指标外,为验证模型结果在心理评估中的实际可用性,本研究邀请具有专业资质的心理咨询师对部分样本进行独立评估。专家依据用户SDS结果及曼陀罗绘画特征给出风险等级判断,并与模型预测结果进行一致性分析。采用皮尔逊相关系数(Pearson Correlation Coefficient)衡量模型预测分数与专家评估结果之间的相关性:

r= ( s i s ¯ )( s i ^ s ^ ¯ ) ( s i s ¯ ) 2 ( s i ^ s ^ ¯ ) 2

其中 s ¯ s ^ ¯ 分别为真实值与预测值的均值。当相关系数显著为正时,表明模型预测结果与专业评估具有较高一致性。

通过分类指标、回归误差与专家一致性分析的多维评价方法,能够全面反映模型在心理风险识别中的性能表现,并为其在实际应用场景中的可靠性提供依据(图5)。

Figure 5. Flowchart of the training process for the multimodal emotion analysis model

5. 绘画的多模态情绪分析模型训练流程图

5.2.2. 初步抑郁检测

此测试的原理图如下所示(图6):

Figure 6. Detection principle diagram

6. 检测原理图

此测试通过结果整合来评估风险,风险等级矩阵如下表2所示:

Table 2. Risk level matrix diagram

2. 风险等级矩阵图

SDS < 50

SDS50~59

SDS > 60

绘画正常

低风险

中低风险

中风险

绘画异常

中风险

高风险

极高风险

用户登录后首先进行ZUNG氏自评量表的检测,结果如下表3所示:

Table 3. ZUNG self-rating scale criteria

3. ZUNG氏自评量表标准

评分

是否得抑郁症

50分以下

正常范围

50~59分

轻度抑郁

60~69分

中度抑郁

70分+

重度抑郁

5.2.3. 数据采集及实时情绪反馈

通过涂色与音乐模块协同,进行双通道数据采集,同步记录涂色行为(颜色/力度/速度)与音乐播放数据(曲目/时长/中断点)。用户可通过弹出窗口即时选择是否需要心理咨询,系统将快速提供专家的联系方式,缩短用户获取帮助的时间。实时情绪反馈如下图7所示:

Figure 7. Real-time emotional feedback diagram

7. 实时情绪反馈图

5.2.4. 分析模块联合心理咨询师

为进一步提升治疗效果,本平台设计联合心理咨询的方案。通过系统分析用户的曼陀罗绘画结果和SDS表数据,结合心理咨询师的专业意见,为用户生成一个基础的报告单。同时系统会根据用户的状态进行不同的咨询评估途径,如下图8所示:

Figure 8. Psychological counseling needs assessment chart

8. 心理咨询需求评估图

6. 结论

本研究设计提出了融合中式曼陀罗绘画与中医五音疗愈的抑郁倾向大学生心理自助平台的构建方法,实现文化适配、数字化集成与闭环干预的融合,依托服务设计解决了传统心理健康服务的多项痛点,通过智能分析引擎实现绘画特征与心理状态的关联评估,为用户提供个性化疗愈方案。本平台尚存绘画解读受文化差异影响、无法替代临床诊断等局限,未来需开展长期追踪研究验证效度,并拓展应用人群;后续将结合多中心临床试验优化算法模型,深化与专业心理咨询平台的协同,提升服务的普惠性与科学性,为心理健康数字化干预提供实践支撑。

基金项目

2025年国家大学生创新创业训练计划项目“意欲几何 无相陀螺——大学生中式曼陀罗绘画心理自助疗愈平台的设计与建构”(项目编号:202513287013)。

NOTES

*通讯作者。

参考文献

[1] 傅小兰, 张侃, 陈雪峰, 陈祖妍. 中国国民心理健康发展报告(2021-2022) [M]. 北京: 社会科学文献出版社, 2023.
[2] 竺腾, 莫苡楠, 金瑞琳, 等. 数字疗法在精神科的临床应用与发展[J]. 中国神经精神疾病杂志, 2023, 49(10): 625-630.
[3] Calvo, R.A. and D'Mello, S. (2010) Affect Detection: An Interdisciplinary Review of Models, Methods, and Their Applications. IEEE Transactions on Affective Computing, 1, 18-37. [Google Scholar] [CrossRef
[4] Baltrusaitis, T., Ahuja, C. and Morency, L. (2019) Multimodal Machine Learning: A Survey and Taxonomy. IEEE Transactions on Pattern Analysis and Machine Intelligence, 41, 423-443. [Google Scholar] [CrossRef] [PubMed]
[5] Fischer, P., Simanyi, M. and Danielczyk, W. (1990) Depression in Dementia of the Alzheimer Type and in Multi Infarct Dementia. American Journal of Psychiatry, 147, 1484-1487.
[6] 葛红敏. ZUNG氏抑郁自评量表(SDS)作为住院患者抑郁障碍常规筛查工具的可行性研究[D]: [硕士学位论文]. 济南: 山东大学, 2009.
[7] 鲁艳桦. 曼陀罗绘画对大学生抑郁的干预效果研究[J]. 中国临床心理学杂志, 2022, 30(2): 321-325.
[8] 黄泽钦, 熊小檍, 杨稣浩, 张心晓, 肖兴平, 罗霞霞, 王宇飞. 五音疗法在临床疾病中的应用及机制研究进展[J]. 中医学, 2024, 13(2): 291-297.
[9] 李爱勇, 编著. 黄帝内经[M]. 北京: 民主与建设出版社, 2021.
[10] 孟沛欣. 精神分裂症患者绘画艺术评定与绘画艺术治疗干预[D]: [博士学位论文]. 北京: 北京师范大学, 2004.
[11] Binaei-Haghighi, B., et al. (2026) ArtCognition: A Multimodal AI Framework for Affective State Sensing from Visual and Kinematic Drawing Cues. arXiv: 2601.04297.
[12] Joan, K., Rae, M., Bonny, M., et al. (1977) The Use of Them and a Claim Psychological Evaluation and Treatment. American Journal of Art Therapy, 16, 123-134.
[13] Torous, J., Bucci, S., Bell, I.H., Kessing, L.V., Faurholt‐Jepsen, M., Whelan, P., et al. (2021) The Growing Field of Digital Psychiatry: Current Evidence and the Future of Apps, Social Media, Chatbots, and Virtual Reality. World Psychiatry, 20, 318-335. [Google Scholar] [CrossRef] [PubMed]