1. 引言
复方血栓通胶囊为理血剂,具有活血化瘀,益气养阴之功效。主治血瘀兼气阴两虚证的视网膜静脉阻塞,症见视力下降或视觉异常、眼底瘀血征象,神疲乏力、咽干、口干;以及用于血瘀兼气阴两虚的稳定性劳累型心绞痛,症见胸闷、胸痛、心悸、心慌、气短、乏力、心烦、口干。丹参作为复方血栓通胶囊主成分之一,为唇形科植物丹参的干燥根和根茎。春、秋二季采挖,除去泥沙,干燥。全国大部分地区都有分布。具有活血祛瘀,通经止痛,清心除烦,凉血消痈之功效。用于胸痹心痛,脘腹胁痛,症瘕积聚,热痹疼痛,心烦不眠,月经不调,痛经经闭,疮疡肿痛。
丹参在中药中运用广泛,企业在中成药的生产过程中会用到丹参,故而丹参的快速无损检测就有很大的应用空间。丹参药材指标包含丹参酮类(含丹参酮IIA (C19H18O3)、隐丹参酮(C19H20O3)和丹参酮I (C18H12O3))和丹酚酸B,鉴于药典复方血栓通胶囊成品指标为丹酚酸B,因此本研究主要采用近红外光谱技术结合化学计量学方法——偏最小二乘法(PLSR),对提取液丹参含量进行检测分析,并建立定量分析模型,以期提供一种新的快速检测丹参质量的方法,能够快速、准确的监控丹参质量,为复方血栓通胶囊生产提供质量合格的中间工段丹参提取液 [1] [2] [3] [4] [5]。
2. 实验部分
2.1. 仪器与试剂
2.1.1. 仪器
MicroNIR OnSite-W手持式近红外光谱仪(美国VIAVI);Simplicity超纯水系统(默克密理博);PTAP-1018-4030超声波清洗机(中外超声波仪器服务部);LC-20AT高效液相色谱仪(岛津5)。
2.1.2. 试剂
丹参提取液(广东众生药业股份有限公司);乙醇(AR);水(超纯水);乙腈(HPLC);甲酸(HPLC);甲醇(AR)。
2.2. 近红外透射光谱采集
丹参提取液光谱采集预处理:收集不同批号的同工段全过程的64批提取液样品,采集光谱前对提取液样品进行反复晃动混匀,然后采集近红外透射光谱。
光谱采集条件:900~1650 nm,扫描次数为100次,分辨率为8 cm−1。丹参提取液原始光谱如图1所示。

Figure 1. NIR original spectrum of Salvia miltiorrhiza extract
图1. 丹参提取液近红外原始光谱
2.3. 丹参提取液含量测定
供试品的制备参照《中国药典》2020版第一部高效液相色谱法(通则0512),取装量差异项下的本品内容物,混匀,取2 ml,精密称定,置具塞锥形瓶中,精密加入50%乙醇20 ml,密塞,称定重量,超声处理(功率300 W,频率为45 kHz) 30分钟,放冷,再称定重量,用50%乙醇补足减失的重量,摇匀,滤过,取续滤液,即得。
3. 数据处理与模型建立
3.1. 数据处理
如图2在运用高效液相色谱法处理所得的数据中基本涵盖整个提取工段丹参含量的范围:2.4696~8.9852 (mg/ml)。

Figure 2. Extraction of Salvia miltiorrhiza content data distribution
图2. 提取丹参含量数据分布
3.2. 模型建立与评定
采集近红外光谱图后,运用VIAVI公司MicroNIR3.1数据分析软件中的偏最小二乘法(PLSR)建立丹参提取液的近红外光谱与含量之间的校正模型。建立模型前,需要筛选出原始光谱中适宜的波段建立模型,这样能够快速提取光谱中的有效信息,缩短建模时间,减少计算量。由于仪器背景或环境会对近红外光谱产生一定影响,还需要对样品光谱进行平滑、微分等适宜的光谱预处理 [6] [7] [8]。
运用留一交叉验证法(Leave-One-Out Cross Validation, LOOCV),以交互验证误差均方根(Root Mean Square Error of Cross Validation, RMSECV)为指标,通过预测残差平方和作为判别依据来确定最佳因子数。对校正集样本和验证集样本的预测误差分别用校正集误差均方根(RMSEC)、验证集误差均方根(RMSEP)、校正集相对偏差(RSEC)和验证集相对偏差(RSEP)考察。以模型决定系数(Determinate Coefficient, R2)来判断模型性能的好坏。建立的模型决定系数(R2)越接近1,说明样品实测值与通过模型得到的预测值之间越接近,进一步证明建立的校正模型稳定性好,预测能力强。当RMSEC和RMSEP值越小且彼此接近(一般在10%以内),表明模型具有好的稳健性。SEC和SEP亦是评价模型性能的重要指标,SEC和SEP值越小且彼此接近,说明模型的稳健性良好并且对未知样品的预测能力较强 [9] [10] [11]。
4. 结果与讨论
4.1. 提取工段丹参含量测定结果
按照1.3项下的方法测定64批不同批次丹参提取液样品的丹酚酸B含量,丹参含量的范围为2.4696~8.9852 (mg/ml)之间,参照2020版《中国药典》规定复方血栓通成品含量不低于0.9000 (mg/g),对比成品与提取液的稀释比例,故有必要在提取工段丹参投入生产过程中对其丹酚酸B含量进行快速质量测定及监控,从而用于生产规模复杂中药体系中间过程的快速质量监控,保证复方血栓通胶囊制剂的安全、有效。
4.2. 光谱预处理
近红外光谱采集过程中,外部环境、药液本身温度、气泡以及仪器性能的改变都会导致光谱基线漂移,进而干扰校正结果,因此在建模前需要对原始光谱进行光谱预处理以提高模型预测精度。VIAVI数据分析软件中常用的光谱预处理方法有:一阶导数(1st)、二阶导数(2nd)、多元散射校正(MSC)、消除常数偏移量、矢量归一化(SNV)等。本研究比较了相同波长范围下的不同预处理方法对丹参提取液含量建模的影响,结果如表1所示。

Table 1. Influence of different pretreatment methods on concentration model of Panax notoginseng
表1. 不同预处理方法对丹参提取液含量模型的影响
通过比较发现,丹参提取液含量在908.1~1676.2 nm的波段范围内,通过Detrend预处理进行处理后得到的模型有较低的RMSEC值和较接近的RMSEP值,且决定系数R2值更接近1。
4.3. 定量模型的建立
4.3.1. 模型效果图
经过异常点判断、光谱预处理以及建模波段选择的步骤后,最终得到由PLSR法所建立的丹参提取液近红外定量校正模型(其中校正集样本60个,验证集样本4个)。获得丹参提取液含量模型的校正集样品真实值和NIR预测值的相关关系,如图3所示,其中R2为0.9580,RMSEC为0.1952。

Figure 3. Correlation diagram of HPLC reference value and NIR predicted value of Salvia miltiorrhiza extract
图3. 丹参提取液HPLC参考值和NIR预测值相关性图
4.3.2. 模型的参数汇总
模型效果参数如表2所示。

Table 2. Parameter summary of extract content model of Salvia miltiorrhiza
表2. 丹参提取液含量模型参数汇总
从表2可以看出,采用Detrend光谱预处理方式,在波段908.1~1676.2 nm内采用偏最小二乘法(PLSR)所建立的丹参提取液含量近红外定量分析校正模型效果最佳。其中,模型校正集实测值与NIR预测值的决定R2系数为0.9850,RMSEC为0.1952,RMSEP为0.8187。
4.4. 定量模型的验证
4.4.1. 模型效果图
为了进一步验证模型的预测能力,本研究根据3.3中所建立的模型来预测验证集样本。丹参提取液含量的NIR预测值和HPLC法测得值的比较如图4所示,模型预测参数汇总见表2。

Figure 4. Comparison of the measured value of salvianolic acid B content in Salvia miltiorrhiza extract by HPLC and the predicted value by NIR
图4. 丹参提取液丹酚酸B含量HPLC实测值和NIR预测值比较
从图4可以直观地看出NIR定量校正模型的预测值与实际测得浸出物含量之间的相关性。
4.4.2. 模型的参数汇总
模型效果参数如表3所示。

Table 3. Parameter table of prediction effect of extract content model of Salvia miltiorrhiza
表3. 丹参提取液含量模型的预测效果参数表
表3结果显示丹酚酸B含量模型的RMSEC值为0.1952,RMSEP为0.8187,说明近红外光谱分析方法基本可以较好地预测丹参提取液的含量 [12] [13] [14] [15] [16]。
5. 结论
本研究建立的复方血栓通胶囊的提取工段丹参提取液含量的近红外快速分析方法,所用的丹参提取液含量的数据由广东众生药业股份有限公司质量控制部门实验室测定。应用PLSR建立的丹参提取液含量的定量校正模型,其决定系数R2为0.9850,RMSEC为0.1952,RMSEP为0.8187,满足定量分析的要求 [17] [18] [19]。所建立的近红外模型能够在较短的时间内通过采集近红外光谱对丹参提取液含量进行测定,相较于传统方法(液相、紫外等)具有简便、快速、无损的优点。