1. 引言
体质分类是中医体质学研究的基础与核心内容,是从复杂的体质现象中提炼出有关规律,最终建成体质分类系统。当前,体质分类主要依赖主观的调查问卷或专家对皮肤状态进行评分进行判定。王琦 [1] [2] [3] 经过近20多年的深入研究,将中医体质分为平和质、阳虚质等9种基本类型,但由于体质的间杂性,会使得普通人无法正确判断本身的体质。
众所周知,专家通过志愿者的皮肤状态,可以判定志愿者所属的体质类型。所以,以下实验将从影响皮肤状态的相关指标出发去研究志愿者的体质类型。而在本实验中,侧重分析阳虚质人群测试皮肤状态,进行客观仪器检测分析,由于阳虚体质又称为“虚寒体质”,常表现为怕冷、手脚凉,因此选取脸颊部分水分含量、经皮失水量、油脂及红外值进行试验设计与模型建立。
本文的研究是基于前人工作的基础上进行的,利用BP神经网络回归 [4] [5] [6] [7] [8] 和主成分回归方法 [9] [10] [11] 去研究体质,以反映其对应的体质类型。
2. 资料与方法
需要说明的是,本文所选用的志愿者指标数据均来自中国化妆品研究中心。
2.1. 观察对象(人)
入选条件:1) 无严重系统疾病、无免疫缺陷或自身免疫性疾病者。2) 测试当天无感冒、头疼发热等症状,受试者应处于健康状态。3) 无活动性过敏性疾病者。4) 既往对护肤类化妆品无过敏史者。5) 近一月内未曾使用激素类药物及免疫抑制剂者。6) 未参加其它临床试验者。7) 志愿参加并能按试验要求完成规定内容者。
排除条件:1) 妊娠或哺乳期妇女。2) 试验期间全身应用激素类、免疫制剂类药物者。3) 未按规定使用受试物或资料不全者。
2.2. 主要指标及仪器
阳虚体质人群畏寒怕冷,四肢不温,因此皮肤温度可能偏低,进而影响皮肤水分散失偏低,同时由于皮肤温度低,皮脂腺分泌降低,皮肤油脂分泌可能减少,因此,我们选取皮肤红外热成像来对阳虚质人群皮肤温度进行测量,同时通过测量皮肤水分含量、经皮失水量以及皮肤油脂分泌量来观察阳虚体质人群皮肤水分情况,探寻阳虚质人群皮肤温度与皮肤指标的规律。
为了准确地利用皮肤状态的相关指标去判定志愿者所属的体质类型,考虑到数据的可获得性,本实验选取以下指标(见表1)作为解释变量。专家评分的平均得分为因变量Y。数据部分可见附录。
2.3. 方法
2.3.1. 基于BP神经网络的结构设计
鉴于表1,本文采用3层BP神经网络(输入层、隐含层、输出层)创建模型 [12] 。试验设计选取表1中所含的4个自变量,输入层神经元的数量为4个,目标函数为1个,输出层神经元的数量为1个,Y为专家评分。需要着重指出的是,专家评分是我们邀请10位皮肤领域不同行业的专家根据多年对体质的研究所打出的分数,最后取平均值而得。隐含层神经元数量的计算公式 [13]
式中p为隐含层节点数,n为输入层节点数,q为输出层节点数,z为经验值(1 ≤ z ≤ 10)。经计算,本文中隐含层神经元数在4~12之间,通过网络性能测试确定隐含层神经元数量为3。BP神经网络的结构如图1所示。
2.3.2. BP神经网络的拟合
为消除输入向量与输出向量的量纲影响,满足传递函数的值域区间,防止输入信号过大导致网络输出饱和,需对训练样本进行归一化处理到区间[−1,1]。
本文利用Matlab R2009b编写BP神经网络计算机程序,对归一化后的训练样本数据进行模型拟合,并与主成分回归模型拟合的结果进行比较。专家评分Y与4项测试指标的BP神经网络模型采用图1的网络结构,网络训练1000次显示一次结果,初始学习率为0.05,规定训练次数为50,000,网络输出误差为0.65 × 10−3。
2.3.3. 置信区间的构造
专家评分
为随机变量,在实际问题当中往往需要知道它的分布范围,即寻找一个区间
,使得Y在其间的概率为1 – γ (0 < γ < 1)。下文在γ = 0.05的条件下,计算该置信区间 [14] [15] [16] 。
此外,由于数据量相对较少,直接从这4个变量出发来评价各位志愿者的皮肤状态等发展情况比较复杂,而采用主成分分析和BP神经网络不仅可以把这些变量进行化简,同时,可以尽可能涵盖数据的大部分信息量。最后,利用回归模型和神经网络模型算出的专家得分判断其所在的置信区间,进而判断所属的体质。

Table 1. The meaning of selected indicators and required equipment of test
表1. 选取的指标含义及测试所需设备

Figure 1. Structure of BP neural network
图1. BP神经网络结构图
3. 实证分析
3.1. 平和质
首先,求取有关平和质的专家评分的置信度为70%的置信区间(6.53,6.69),若在置信区间之内,则认为正确。接着利用上述介绍的方法进行建立模型。
3.1.1. 建立主成分回归模型
主成分分析的原理是利用降维的思想,在保证原始数据信息损失最小的前提下,将原来指标重新组合成一组新的互相无关的几个综合指标 [9] 。
借助R软件进行主成分回归,得到主成分回归统计预报模型:
经计算可得,方程所对应的P值为0.009063 < 0.01,因此,方程是显著的。
拟合样本个数50个,正确31个,方程拟合率62%;检验样本个数43个,正确20个,检验准确率46.51%。
3.1.2. 建立BP神经网络模型
1989年Robert HechiNilson证明一个单隐含层的BP网络可以逼近任意连续函数 [17] ,从目前看隐含层的神经元数目选取具有一定任意性。在通过对不同隐含层节点数目BP网络测试后,选定3层BP神经网络进行训练建立模型,即输入层由4个节点组成、隐含层由3个节点组成、输出层由1个节点组成。初始化各层的连接权值及阈值,赋予(−1,1)之间的随机值。
方法:选用Matlab平台,训练函数选用量化连续梯度BP训练函数,激活函数选用sigmoid,训练次数50,000,学习率0.05,收敛误差0.65 × 10−3。
结果:拟合样本个数50个,正确50个,方程拟合率100%;检验样本个数43个,正确41个,检验准确率95.35%。
3.2. 阳虚质
首先,求取有关阳虚质的专家评分的置信度为70%的置信区间(6.69 6.90)。接着利用上述介绍的方法进行建立模型。
3.2.1. 建立主成分回归模型
同理可得主成分回归统计预报模型:
经计算可得,方程所对应的P值为0.3821 > 0.05,因此,方程是不显著的。
拟合样本个数30个,正确14个,方程拟合率46.67%;检验样本个数11个,正确4个,检验准确率36.36%。
3.2.2. 建立BP神经网络模型
同理,可得到以下结果:拟合样本个数30个,正确30个,方程拟合率100%;检验样本个数11个,正确9个,检验准确率82.82%。
4. 小结
由于体质类型和皮肤状态有着密不可分的关系,专家们也经常根据受试者的皮肤状态判断其体质类型。所以,本文主要是先将受试者进行分类,即分成不同的体质类型,然后根据采集到的皮肤数据及专家评价,用自助法求出在不同体质类型下专家评分的置信区间。但是,仅仅依靠专家对皮肤状态的观察来判断体质有些片面,所以本文通过仪器测试与体质有着紧密联系的皮肤状态相关指标,进而判断受试者的体质类型。这样就能够更加全面的了解皮肤状态,从整体观的角度判断皮肤的状态,进而更能深入的了解体质类型。
本实验所提供的一种基于皮肤测量的体质类型评估方法及评估系统。在该评估方法中,首先采用皮肤检测仪器对用户的皮肤状况进行测试,获得表征皮肤状态的多项生理指标;根据各项生理指标,采用BP神经网络和主成分分析法生成模型,将模型的评价结果与多位中医师的专家评分结果进行比较、优化;基于模型,可以对用户的体质类型进行综合评价。利用本实验结果,可以通过对皮肤状态的综合测量和评价,科学客观地判断出人的体质类型。该评估方法及评估系统不仅准确率高,而且可以利用现有的计算机设备独立进行,完全摆脱了对中医师个体经验的依赖,便于大规模推广应用。
并且,通过皮肤数据采集后,志愿者能够很清晰的了解到自身全面的皮肤状态,对于今后的护肤品的选择提供指导性的意见。此外,化妆品企业通过获得皮肤模型得分能够很清晰的了解到消费者的皮肤状态,通过消费者的皮肤状态的信息获得能够更有针对性的开发产品,并能够更有针对性的将此部分产品投向靶向市场。
5. 讨论
1) 由于样本较少,在训练BP神经网络模型时受到一定影响,导致部分检验和预报准确率不高。下一步打算:将各类体质数据继续收集,将重新训练BP神经网络模型,随着样本数的增加会得到准确度更高的预报模型。
2) 本实验所用指标数据采用标准化处理,消除了量纲差异带来的影响,使拟合和预报效果均达到较好效果。但由于影响专家评分的因素很多,因此,如何充分考虑这些因素提高预报水平和准确率,有待进一步研究。
基金项目
2017年研究生科研能力提升计划项目资助,科研基地建设–重点实验室–中国轻工业化妆品重点实验室2017 (项目号:19008001349)。
附录
平和质(仅选取部分样例)
阳虚质(仅选取部分样例)
知网检索的两种方式:
1. 打开知网页面 http://kns.cnki.net/kns/brief/result.aspx?dbPrefix=WWJD
下拉列表框选择:[ISSN],输入期刊ISSN:2324-7991,即可查询
2. 打开知网首页http://cnki.net/
左侧“国际文献总库”进入,输入文章标题,即可查询
投稿请点击:http://www.hanspub.org/Submission.aspx
期刊邮箱:aam@hanspub.org