摘要: 目的:应用数据挖掘技术探究中药复方治疗干燥综合征的用药规律。方法:检索国家知识产权局中与“干燥综合征”相关的中药发明专利,筛选符合纳入标准的中药复方,运用R语言进行频次统计、性味归经、功能类别分析、聚类分析和复杂网络分析。结果:共纳入59项专利,涉及291味中药,麦冬、石斛、生地等为高频药物。常见药物多属滋阴润燥、益气清热类,药性多寒、甘、苦,归肺、肝、胃经。聚类分析显示复方结构以滋阴、益气、通络三类药物为主;网络分析揭示麦冬–石斛、黄芪–麦冬等药对为核心节点。结论:中医治疗干燥综合征强调“阴虚燥热、气津两伤”,中药复方配伍体现辨证施治与协同机制,数据挖掘可为其优化提供方法支持。
Abstract: Objective: To explore the medication patterns of Chinese herbal compound prescriptions for Sjögren’s syndrome (SS) using data mining techniques. Methods: Chinese herbal formula patents related to SS were retrieved from the Chinese National Intellectual Property Administration (CNIPA). Eligible prescriptions were analyzed through frequency statistics, property-flavor-meridian analysis, functional categorization, clustering, and complex network construction using R language. Results: A total of 59 patent formulas involving 291 herbs were included. Frequently used herbs such as Ophiopogonis Radix, Dendrobii Caulis, and Rehmanniae Radix were mainly classified as yin-nourishing, heat-clearing, and qi-tonifying. The herbs were primarily cold in nature, sweet or bitter in taste, and entered the lung, liver, and stomach meridians. Cluster analysis revealed three major herbal groups: yin-nourishing, qi-tonifying, and channel-unblocking. Complex network analysis identified core herb pairs including Ophiopogonis Radix-Dendrobii Caulis and Astragali Radix-Ophiopogonis Radix. Conclusion: The treatment of SS in traditional Chinese medicine emphasizes syndromes of yin deficiency and dryness-heat. Herbal compound prescriptions reflect the principles of pattern differentiation and synergistic action. Data mining provides a scientific method for revealing and optimizing traditional formula structures.
1. 引言
干燥综合征(Sjögren’s Syndrome, SS)是一种以外分泌腺体功能障碍和淋巴细胞浸润为主要病理特征的慢性系统性自身免疫性疾病[1]。临床表现以口干、眼干、腮腺肿大、疲乏无力、关节疼痛为主,常可累及泌尿、生殖、呼吸、消化、神经等多个器官系统。根据临床表现及是否合并其他结缔组织病,SS可分为原发性(primary SS, pSS)与继发性(secondary SS, sSS)两类,后者多与系统性红斑狼疮、类风湿关节炎等自身免疫病并发。现代医学认为其发病机制与遗传易感性、体液免疫紊乱、细胞免疫异常及微生态失衡等因素密切相关。目前西医治疗主要依赖糖皮质激素、免疫抑制剂、人工泪液和唾液替代疗法等,对部分患者需联合使用生物制剂如利妥昔单抗(Rituximab)等B细胞靶向药物,但其疗效有限,副作用不容忽视,且经济负担较重。中医认为本病属“燥证”、“痹证”、“脏躁”等范畴,病机以阴虚津亏、脾肺两伤为本,虚实夹杂,邪正交争。中医治疗以滋阴润燥、益气养血、通络化痰为法,尤能兼顾缓解症状与调节免疫功能,其“整体调理”的优势逐渐获得现代医学的关注。近年来,国家中药专利数据库中积累了大量关于中药治疗SS的创新配方。基于此,本研究运用数据挖掘方法,系统梳理相关中药复方的配伍特征,探索其用药规律,旨在为干燥综合征的中医药临床诊治提供科学依据与用药参考。
2. 资料与方法
2.1. 数据来源与检索策略
本研究依托国家知识产权局官网(http://www.cnipa.gov.cn),在“专利检索及分析系统”中进行高级检索。检索策略设定为:“发明名称 = (干燥综合征) AND摘要 = (中药)”,时间范围为数据库建立之日起至2025年5月1日。为保证数据质量,由两名中医药研究人员独立执行筛选流程:研究员甲依据标题和摘要进行初步筛查,研究员乙复核专利全文,最终形成纳入样本。检索与筛选流程遵循PRISMA数据提取原则,确保结果的系统性和可重复性。
2.2. 纳入与排除标准
纳入标准:① 明确用于治疗干燥综合征的中药复方;② 每组复方中药味数不少于三味;③ 专利中明确列出中药组成及功能主治。排除标准:① 含有西药成分或化学合成药物的复方;② 药物组成完全重复、内容一致的专利条目(仅保留首次申报版本);③ 专利文献中缺乏完整中药组方信息或无法识别药物名称的文献。
2.3. 数据整理与标准化
为确保药物名称规范统一,参照《中华人民共和国药典》(2020年版),对药材名称进行标准化处理。例如:“仙灵脾”统一标注为“淫羊藿”,“炙黄芪”归类为“黄芪”等。采用双人双录法进行Excel数据录入,利用盲审交叉验证,数据差异率控制在1%以下,确保数据准确性与可重复性。
2.4. 数据分析方法
数据分析主要在R语言环境中(版本4.2.0)进行,结合“arules”“ggplot2”“igraph”等常用数据挖掘与可视化工具,完成如下分析任务:频次统计分析:计算各中药出现频率;性味归经分析:对药物四气、五味及归经分布进行统计;类别归属分析:依据药理作用分类,如清热药、补益药等;关联规则分析:运用Apriori算法挖掘药物间高频组合(置信度、支持度分析);聚类分析:基于药物使用特征进行层次聚类,探索核心方群;复杂网络分析:构建药物网络图谱,分析其节点中心性与组合密度。
3. 结果
3.1. 药物使用频次分析
经筛选共纳入59项治疗干燥综合征的中药复方专利,涉及中药材291味,总用药频次达620次。通过R语言对药物频次进行统计分析,得出引用频次 ≥ 8次的核心中药共15味,其累积使用频次为166次,占总用药频次的26.77%。其中,使用频次排名前五的药物分别为:麦冬:29次(4.67%)、石斛:24次(3.87%)、生地黄:19次(3.06%)、玄参:14次(2.26%)、黄芪:13次(2.10%)。图1展示药物频次(≥8次)柱状图,直观反映主要用药趋势。
Figure 1. Bar chart of medication frequency (≥8 occurrences)
图1. 药物频次(≥8次)柱状图
3.2. 药物性味与归经分析
根据291味药物的药性统计结果可知,其四气属性以寒性、温性和平性为主,具体占比如下:寒性药占38.14%,温性药占27.84%,平性药占20.27%,微寒与微温合计占13.75%。五味分布以甘、苦、辛为主,分别占据总药物的35.12%、30.58%、18.56%,提示临床组方常以甘缓药调和营卫、苦寒药清泄燥热、辛散药通达气机。在归经分布方面,以肝经、肺经、胃经、肾经、心经为主要归属脏腑,分别占据45.36%、38.45%、34.02%、28.18%、21.27%的药物归经频次(图2)。
Figure 2. Proportional analysis chart of four properties, five flavors, and meridian tropisms (in the form of a pie chart or radar chart)
图2. 四气、五味、归经比例分析图(饼图或雷达图形式)
3.3. 药物类型分析
对291味中药的功能分类进行统计,结果显示复方中使用频率较高的药物类型主要包括:清热药(如黄芩、生地、玄参):占比21.60%;补益药(如黄芪、麦冬、石斛):占比21.60%;活血化瘀药(如丹参、赤芍、川芎):占比10.70%;祛风除湿药(如防风、羌活、秦艽):占比8.90%;利水渗湿药(如茯苓、泽泻、车前子):占比8.20% (图3)。
Figure 3. Proportional distribution of various functional categories of Chinese medicinal herbs
图3. 各类功能中药比例分布图
3.4. 药物聚类分析
本研究采用R语言中hclust()函数对高频药物进行层次聚类(Hierarchical Clustering),以Jaccard相似系数计算药物间共现关系的距离矩阵,聚类算法选用Ward.D2法,对频次 ≥ 8次的15味中药进行聚类,最终得出5组核心药物组合(图4为高频中药聚类树状图)。第一类包括川芎、当归、茯苓、玄参、沙参。第二类包括五味子、天花粉、生地。第三类包括白术、甘草、葛根、乌梅、百合。第四类包括山药、玉竹。第五类包括白芍、石斛、黄芪、沙参、麦冬。
Figure 4. Cluster dendrogram of high-frequency Chinese medicinal herbs
图4. 高频中药聚类树状图
3.5. 药物复杂网络分析
为进一步揭示中药复方中药物间的共现结构与核心配伍关系,本研究基于频次 ≥ 8的15味核心中药,采用R语言“igraph”包构建药物共现网络。网络中节点表示中药,边表示药物共现关系,边权值越大表明两药物共同出现的频率越高。图5干燥综合征核心中药复杂网络图网络结构分析结果显示:网络密度为0.43,表明药物之间存在较多稳定配伍关系。
Figure 5. Complex network diagram of core Chinese medicinal herbs
图5. 核心中药复杂网络图
4. 讨论
干燥综合征(SS)作为一种典型的系统性自身免疫病,其临床症状涉及多器官系统,病因复杂、治疗困难,严重影响患者生活质量。中医认为本病属“燥证”范畴,尤以“肺燥”“阴虚”“痹阻”为主。阴虚为本,燥热为标,治宜滋阴清热、益气生津、活血通络。
本研究通过对59项国家专利中药复方进行数据挖掘,揭示了当前中医治疗SS的核心药物结构、性味归经特点、配伍规律及网络特征。研究发现,麦冬、石斛、生地、黄芪、玄参等为高频药物,体现出治疗以滋阴润燥、补气养液为主线。其中麦冬味甘,微苦、微寒,无毒,归属于心、肺、胃经,有养阴润肺,清心除烦、益胃生津的作用。《本草经集注》云:麦冬主治心腹结气,伤中,伤饱,胃络脉绝……虚劳客热,口干燥渴,止呕吐。现代药理学研究表明,麦冬皂苷D已经证实其具有抗心衰、保护心肌细胞、舒张十二指肠平滑肌、抗疲劳、保护肺损伤和抗炎抗氧化等药理作用[2]。于绍卉[3]研究发现,麦冬多糖可能通过抑制TLR4/MyD88/NF-κB信号通路来降低促炎因子IL-1β、TNF-α、IL-6的合成和分泌,发挥抗炎活性。有研究表明麦冬的黄酮类提取物石斛味甘,微寒,归胃、肾经,有养胃生津,滋阴除热的作用。《得配本草》云:石斛除胃中虚热,而止烦渴。清中有补,补中有清。现代药理学研究表明,石斛提取物可通过减轻脂质过氧化损伤、清除自由基、抑制iNOS活力、减少NO过量生成及减少血清促炎因子IFN-γ,TNF-α的释放,从而阻断炎症过程[4] [5]。生地甘、苦,寒。归心、肝、肾经,有清热凉血,养阴生津的作用。《雷公炮制药性解》云:生地入四经以清诸热。老人津枯梗结,妇人崩漏,及产后血攻心者,尤为要药。实脾药中用二三分,使脾家永不受邪。现代药理学研究表明,地黄提取物可以提高去势大鼠血清CT水平,降低血清中ALP、TRAP、BGP、PTH、PICP水平,具有抑制破骨细胞的活性,减少骨吸收,降低骨转换速率作用,对骨代谢有一定的调节作用[6]。黄芪味甘,微温,归睥、肺经,有补气升阳,益卫固表,托毒生肌,利水退肿的作用。《名医别录》云:黄芪治妇人子藏风邪气,逐五藏间恶血,补丈夫虚损,五劳羸瘦,止渴,腹痛泄利,益气,利阴气。现代药理学研究表明黄芪甲苷通过下调TGF-β1表达,抑制PI3K/Akt/mTOR信号增强肺组织细胞自噬活性,抑制肺组织炎性反应,阻止上皮间质转分化过程,在IPF的治疗中发挥作用[7]-[9]。玄参味苦、甘、咸,寒,归肺、胃、肾经,有清热,解毒,养阴的作用。《玉楸药解》云:玄参清肺金,生肾水,涤心胸之烦热,凉头目之郁蒸、瘰疬、斑疹、鼻疮、喉痹皆医。现代药理学研究表明玄参提取物可能通过调节miR⁃646的表达而缓解糖尿病视网膜水肿[10]-[12]。
性味分析结果显示,药性以寒、平为主,五味多甘苦辛,归经偏重于肺、肝、胃、肾,此四脏是与津液代谢关系最为密切的脏腑。同时也与干燥综合征的主要病机密切相关:肺主皮毛、司呼吸、开窍于鼻,口干、鼻咽干源于肺阴不足;肝藏血、主疏泄,阴血亏虚则目干易燥;脾胃为生化之源,津液不足又可追溯至脾失运化。《素问·至真要大论》曰:“五脏化液,心为汗,肺为涕,脾为涎,肝为泪,肾为唾。”干燥诸证,皆津液所生之“液”失其常,故肝肺脾肾之调和为治燥关键。
聚类分析显示药物可分为五类,其中前三类体现核心辨证逻辑:第一类以川芎、当归、茯苓、玄参、沙参为主,药性偏寒凉,味甘苦,归肺肾经,功能滋阴清热、润肺生津,适用于阴虚燥盛型SS,症见口干咽燥、形体消瘦、舌红少津。第二类含五味子、天花粉、生地,性平微温,入脾肺经,主益气固表、健脾渗湿,可改善气阴两虚型SS患者的体虚乏力、自汗。第三类包括白术、甘草、葛根、乌梅、百合,性苦寒入血分,功能清热解毒、活血通络,适用于夹实夹瘀型SS,症见关节红肿、腺体肿胀、舌红苔黄。第四类山药、玉竹及第五类白芍、石斛、黄芪、麦冬等药物则辅助强化益气养阴、津液化生与输布功能。此分类与《温病正宗》“燥证宜分三法(清燥、润燥、凉血)”理论相呼应,体现SS“阴虚燥热、气虚津亏、夹瘀痹阻”的核心病机。
复杂网络分析进一步揭示关键药对协同规律:麦冬与石斛共现频率最高(13次),二者配伍源自滋阴润燥经典法,既符合《本草纲目》“益胃生津,润燥清热”的传统认知,亦被现代研究证实可协同上调AQP5表达,促进唾液分泌。黄芪与麦冬配伍(共现11次)出自“生脉保元汤”,通过益气生津、固表止汗改善免疫微环境,其机制涉及调节Treg/Th17平衡及提高抗氧化酶活性。生地–玄参(共现10次)则为凉血养阴组合,针对燥热伤阴病机,抑制过度免疫激活。从配伍层级看,高中心性药物如黄芪、麦冬多作为君药或臣药主导益气滋阴核心作用,而玄参、赤芍等边缘节点常作为佐使药辅助通络散瘀、引经增效,整体体现“多靶点、层级结构”的复方配伍逻辑。
尽管本研究通过数据挖掘技术初步揭示了中药复方治疗干燥综合征的用药规律,但仍存在若干局限性,需在解读结果与未来研究中审慎考虑。首先,检索策略可能存在潜在遗漏。本研究仅检索了国家知识产权局的专利数据库,未覆盖国外专利库(如WIPO)、学术期刊数据库中的方剂数据或灰色文献(如学位论文、临床试验注册方案)。检索条件限定为“发明名称 = (干燥综合征) AND摘要 = (中药)”,这可能导致那些未在标题或摘要中明确提及“干燥综合征”但实际适用于该病证候的中药复方(例如,治疗“阴虚燥热”或“痹证”的通用方剂)被排除在外。其次,样本量相对有限。本研究最终仅纳入59项专利,291味中药。虽然数据挖掘技术在小样本下仍可进行探索性分析,但样本量的限制可能影响统计结果的准确性和普适性。例如,专利数据本身在不同技术领域分布不均,样本量稀少可能增加偶然因素的干扰、使统计结果降低或失去统计学意义,难以得到非常可靠的结论。最后,专利数据固有的截断性问题也可能带来影响。专利从申请到公开之间存在一定时滞,本研究检索截止至2025年5月1日,这意味着近期申请但尚未公开的专利无法被纳入分析,可能导致结果未能完全反映最新的研发动态。承认这些局限性并非否定本研究价值,而是旨在为更客观地解读研究结论提供背景,并指出未来研究可以改进的方向。后续研究可考虑扩展数据来源(如结合临床文献与专利数据)、优化检索策略以降低遗漏风险、扩大样本量以及应用更先进的算法模型来减轻数据固有偏见的影响。
综上所述,干燥综合征的中医药治疗在配伍思路、理论依据与现代药理机制方面呈现出高度一致性。数据挖掘技术不仅验证了经典理论,更推动了从“经验传承”走向“证据链条”的学术转型。后续应加强药理验证、机制研究与循证临床试验,推动中药治疗SS标准化、个体化进程。
5. 结论
本研究基于数据挖掘技术系统分析了国家中药专利中治疗干燥综合征的中药复方用药规律。结果显示,中医治疗干燥综合征以滋阴润燥、益气养阴、清热活血为主要治则,常用药物包括麦冬、石斛、生地、黄芪、玄参等,性味以寒、甘、苦为主,归肺、肝、胃经为多。通过频次统计、关联规则、聚类分析及网络分析,发现复方中存在稳定的药对结构和核心方群,其配伍逻辑体现出中医辨证施治、君臣佐使、多靶点干预的理论精髓。研究结果揭示了潜在的用药规律与核心药物组合,为未来的实验研究和临床验证提供了新的假说和方向。建议今后进一步开展药效实验与循证研究,推动干燥综合征的中医药治疗向标准化、精准化方向发展。
NOTES
*通讯作者。