1. 引言
乙型肝炎病毒(HBV)感染是一个主要的全球健康问题。HBV感染除了引起肝脏疾病,可能与其他自身免疫性疾病有关。多达25%的慢性HBV感染患者报告有关节炎症状 [1] 。类风湿性关节炎(rheumatoid arthritis, RA)是一种慢性自身免疫性疾病,每年发病率为25~50/100,000人 [2] ,其确切的发病原因尚不完全清楚,但遗传、环境和生活方式因素都可能与其发病有关 [3] [4] 。尽管已有研究表明HBV可能与RA有关,但它们之间的确切关系仍然不清楚。本研究收集GEO公共数据库中的基因芯片数据,使用验证队列筛选差异基因,通过免疫组化(IHC)和免疫荧光(IF)的方法对HBV合并RA患者外周血单个核细胞样本中关键基因进行验证,旨在明确调控HBV和RA的关键基因,更好地理解HBV和RA的关联,对于深入了解这两种疾病的发病机制、开发新型生物标志物和潜在治疗靶点都具有重要意义。
2. 材料和方法
2.1. 数据采集
在GEO数据库中使用“HBV”或“RA”为关键词,搜索与这两种疾病相关的基因芯片数据。筛选编号GSE119322,GSE58208为外周血单个核细胞HBV芯片,共包含37例HBV患者和12例健康对照。GSE68689,GSE110169为外周血单个核细胞RA芯片,共包含102例RA患者和80例健康对照,HBV和RA患者GEO数据集信息见表1。为了使数据更适合后续的基因表达谱分析,对筛选出来的数据进行log2转换。为了得到每个基因的表达水平,根据相应平台的注释文档,将探针与其基因符号进行匹配。数据输出以行名为样本名,以列名为基因符号的基因矩阵,将用于后续的分析。
2.2. 临床样本收集
收集2022年10月至2023年5月在山东大学齐鲁医院就诊健康查体志愿者(n = 5),HBV患者(n = 5),乙肝患者(n = 5),HBV合并乙肝患者(n = 5)的外周血样本。所有样本获得患者书面知情同意。本研究获得山东大学齐鲁医院伦理委员会批准(KYLL-202210-069-1)。
2.3. 加权基因共表达网络分析(WGCNA)
使用WGCNA方法来获得HBV和RA相关的模块。使用R软件4.0.3中的“WGCNA”包进行WGCNA分析和软阈值选择。使用该软件包中的“Select Soft Threshold”功能选择了适当的软阈值β (介于1~20之间),以符合无尺度网络标准。利用Pearson相关性分析计算出所有基因对的软阈值β,并使用基因相关矩阵构建邻接矩阵(adjacency matrix)。计算公式为aij = |sij|β (aij为邻接矩阵,介于基因组之间的相关矩阵;sij为相似矩阵,由所有基因对的Pearson相关系数p计算而来;β为软阈值)。将拓扑重叠矩阵(TOM)和相应的不相似度矩阵(1-TOM)从邻接矩阵转换为拓扑重叠矩阵。构建系统聚类树图,将相似的基因表达划分为不同的模块。利用模块特征基因(ME)总结了各模块的表达谱,并计算了ME与临床特征之间的相关性。选择与临床特征高度相关的模块,从中选择后续分析所需的基因。在HBV的WGCNA分析中,软阈值β设为2;而在RA的分析中,软阈值β设为3。其他参数设置如下:networktype = “unsigned”,minmodulesize = 20,mergecutheight = 0.25和deepsplit = 2。
2.4. Glue Go进行基因本体(GO)富集分析
利用Glue Go包中的“goana”函数对基因表达数据进行GO富集分析。选择显著性水平为0.05,并根据需要进行多重比较校正。利用Glue Go包中的“gogplot”函数绘制GO富集分析结果的可视化图。
2.5. 差异基因分析
在GEO数据库中获得HBV (GSE58208)和RA (GSE15573)数据集,验证共享基因的差异表达,使用热图对结果进行可视化。截止值为|log2(foldchange)| > 1,p < 0.05。
2.6. 免疫组化(IHC)
外周血用4%多聚甲醛固定,通过室温下3%过氧化氢溶液孵育抑制内源性过氧化物酶活性。将抗原表位与20%的正常山羊血清孵育1 h,与一抗(DYNLT1、GRIPAP1、kiAA2013、MLF2和TRAFD1,Abcam)在4℃下孵育12 h。用水洗涤3次,将载玻片与HRP偶联的二抗在室温下孵育1 h。使用DAB显色试剂观察切片,用苏木精进行复染。利用奥林巴斯荧光显微镜系统拍摄图像,每个视野至少包含5个随机重叠区域。
2.7. 免疫荧光(IF)
载玻片的制备方法与IHC相同。与IHC不同的是,使用了Alexa Fluor 488和Alexa Fluor 594偶联的二抗(1:1000)来代替HRP偶联的二抗,并用DAPI染液对细胞核进行染色。不需要使用DAB显色试剂,直接用苏木精进行复染即可。
2.8. 统计学分析
利用GraphPad Prism 8.0.2软件对数据进行统计。对计量资料进行正态性检验,符合正态分布的数据,运用Student’s t检验评估两组之间的变量差异,Tukey多重比较检验法比较多组之间的差异,p < 0.05作为统计学意义的判断标准。
3. 结果
3.1. HBV和RA关键基因的筛选



(A) HBV共表达基因的簇状树状图;(B) RA中共表达基因的簇状树状图;(C) HBV中的模块–性状关系;(D) RA中的模块–性状关系;(E) HBV的天蓝色和浅黄色模块与RA的绿松石模块重叠的共享基因;(F) Glue Go进行基因本体(GO)富集分析
Figure 1. WGCNA and Clue GO enrichment analysis
图1. WGCNA和Clue GO富集分析
通过WGCNA分析在GSE119322和GSE58208数据集中确定29个模块,每个颜色代表不同的模块。如图1(A),图1(B)所示,根据Spearman相关系数绘制模块–性状关系热图,以评估各模块与疾病的相关性。两个模块“天蓝色”和“淡黄色”与HBV高度相关,被选为HBV相关模块(天蓝模块:r = 0.43,p = 0.04;淡黄色模块:r = 0.46,p = 0.02)。天蓝色和淡黄色模块与HBV正相关,分别包含98和97个基因。如图1(C),图1(D)所示,在GSE68689、GSE110169中共鉴定出19个模块,只有模块“绿松石色”与RA (r = 0.42, p = 0.04),包括415个基因。如图1(E)所示,在HBV和RA的阳性相关模块中,有44个共享基因与HBV、RA相关。为了探索共享基因的潜在机制,我们用Glue Go进行了GO富集分析,与两个疾病相关的信号通路分别是锌离子结合信号通路、I-κB激酶/NF-κB信号通路、外源性凋亡的正调控信号通路、泛素特异性蛋白酶结合信号通路和聚泛素结合信号通路(见图1(F))。这些结果有助于进一步了解HBV和RA的发病机制,为未来的研究提供有价值的线索。

Table 1. HBV and RA patient GEO data set information
表1. HBV和RA患者GEO数据集信息
3.2. HBV和RA关键基因的鉴定
为了消除数据中的冗余,提高数据的质量和效率,本研究对HBV的数据集GSE58208和RA数据集GSE15573进行PCA分析,如图2(A)所示。差异分析显示,与对照组相比,HBV和RA中DYNLT1、GRIPAP1、kiAA2013、MLF2和TRAFD1基因均显著上调,差异有统计学意义(p < 0.05,图2(B),图2(C))。

(A) PCA分析HBV和RA的数据集;(B) 热图显示共享基因在健康对照组、HBV组及RA组的表达;(C) 小提琴图展示DYNLT1、GRIPAP1、kiAA2013、MLF2和TRAFD1的表达
Figure 2. Differential analysis of key genes of HBV and RA
图2. 差异分析HBV和RA关键基因
3.3. HBV合并RA中关键基因的验证
为了进一步验证HBV和RA中的关键基因,我们收集健康查体志愿者(n = 5),HBV患者(n = 5),乙肝患者(n = 5),HBV合并乙肝患者(n = 5)单个核细胞对DYNLT1、GRIPAP1、kiAA2013、MLF2和TRAFD1表达进行验证。IF结果显示与健康对照组相比,HBV-RA组中MLF2 (p = 0.0011)和TRAFD1 (p = 0.0003)表达显著上调,差异有统计学意义(图3(A),图3(B))。IHC显示与健康对照组相比,HBV-RA组中MLF2 (p = 0.0004)和TRAFD1 (p < 0.0001)表达均增多,差异有统计学意义(图3(C),图3(D))。
4. 讨论
RA的发病机制尚不清楚,Trépo C.等研究表明HBV和RA之间存在病理联系,提示HBV可能是诱发RA的重要因素 [5] 。然而,HBV诱导RA的分子机制尚不清楚,仍需深入研究。WGCNA是一种强大的算法,可以专门筛选与临床性状相关的基因,并获得具有较高生物学意义的共表达模块。为了更深入地理解RA和HBV之间的内在联系,我们首次利用WGCNA的方法探索了HBV和RA的共同基因和信号通路。
在本研究中,通过WGCNA分析,筛选出了5个与HBV和RA发生发展相关的关键基因:DYNLT1、GRIPAP1、KiAA2013、MLF2和TRAFD1。提示这些基因可能在HBV感染或RA的发病机制中起着重要的作用。例如,DYNLT1是一种细胞质动力蛋白家族的成员,负责物质沿微管运输 [6] 。它可调节初级纤毛的长度,并与动力蛋白相互作用,促进纤毛蛋白的转运 [7] 。DYNLT1异常表达与男性不育密切相关 [8] 。此外,DYNLT1在体外促进乳腺癌细胞的增殖、迁移、侵袭和线粒体代谢,在体内促进乳腺癌的发展 [9] 。GRIPAP1属于GRIP相关蛋白,为小G蛋白Ras家族(RasGEF)的鸟嘌呤核苷酸交换因子 [10] 。有报道显示其可以促进乳腺癌的转移 [11] [12] ,并且与去势抗性前列腺癌也有关 [13] 。KiAA2013是一种分子量为69157 Da由634个氨基酸组成的膜蛋白 [14] ,其在疾病中的作用尚不清楚。尚未见文献报道这些基因在HBV或RA中的作用,我们结果提示DYNLT1、GRIPAP1、KiAA2013等关键基因可能在HBV或RA的发病机制中发挥重要作用。
本研究通过IHC和IF检测了健康志愿者,HBV患者,RA患者,HBV合并RA患者5个关键基因的表达,最终确定了MLF2和TRAFD1在HBV相关RA中表达升高。髓系白血病因子2 (MLF2)是髓系白血病因子家族的一个成员,是核膜泡的腔内成分,可以减少含苯丙氨酸–甘氨酸重复序列的核孔蛋白的积累,在活细胞成像和功能表征方面具有广泛的用途 [15] [16] 。MLF2已被证明与突变的杭丁顿蛋白(HTT)相互作用,并抑制HTT的聚集和毒性 [17] 。TRAFD1 (FLN29)是一种先前显示抑制单核细胞/巨噬细胞中的Toll样受体信号传导的蛋白质,从而抑制对先天免疫的炎症反应 [18] 。它与Plekhm1相互作用并调节破骨细胞酸化和再吸收 [19] 。此外,MLF2可能作为乳腺癌和慢性粒细胞性白血病的致癌因子 [20] 。MLF2通过抑制USP7与p53的结合,拮抗USP7介导的p53去泛素化,从而导致p53失稳促进结直肠癌的发生 [21] 。Bhuvanesh Dave等研究发现由HIF1α介导的缺氧增加了iNOS信号通路,同时诱导了MLF2的表达。iNOS的特异性抑制剂,通过抑制iNOS以剂量依赖的方式降低MLF2的表达。此外,HIF1α同时减少,表明iNOS和HIF1α之间的串扰是受MLF2调节的。这些数据表明,MLF2在iNOS和HIF1α之间的串扰中起着关键作用,可以促进一氧化氮合酶信号传导 [22] 。NO的过量产生可诱导炎性细胞因子的产生和释放,并作为自由基气体积累并引发氧化应激,NOS/NO信号通路在RA的发病机制中起关键作用 [23] 。HBV能够上调人肝细胞中NOS2基因的表达,可能介导慢性病毒性肝炎的病程 [24] 。尚未见文献报道这些基因在HBV相关RA的作用,我们结果显示MLF2和TRAFD1在HBV相关RA中表达升高,提示其可能在发病机制中起着重要的作用,可能成为未来研究的重要方向。
本研究进一步确定了与HBV与RA两个疾病相关的信号通路分别是锌离子结合信号通路、I-κB激酶/NF-κB信号通路、外源性凋亡的正调控信号通路、泛素特异性蛋白酶结合信号通路和聚泛素结合信号通路。例如,锌离子引发乙型肝炎病毒衣壳蛋白的构象变化和寡聚化 [25] 。核因子-κB (NF-κB)激活级联反应在免疫反应、炎症和细胞凋亡中起着至关重要的作用。外部凋亡途径是由死亡配体触发的细胞表面死亡受体发出的信号启动的 [26] 。死亡配体的结合导致了死亡受体信号平台的形成和随后的凋亡启动 [27] 。泛素特异性蛋白酶(USP)是最大的DUB家族,种类最强,在调节免疫细胞功能、调节免疫应答以及参与肿瘤进展过程中的抗原加工和呈递方面发挥关键作用 [28] 。泛素特异性蛋白酶(USPs)是一种去泛素化的酶,多聚泛素结合可以与ABIN1相互作用抑制TLR-MyD88下游信号对预防自身免疫至关重要 [29] 。例如,Xiaobo Luo等研究发现 [30] ,与骨关节炎相比,RA-FLS中USP5的表达上调,并且USP5过表达显著加剧促炎细胞因子的产生和相关的核因子κB (NF-κB)信号转导激活。此外,发现USP5与肿瘤坏死因子受体相关因子6 (TRAF6)相互作用并去除其K48连接的多泛素化链,从而稳定TRAF6。这些研究显示,USP5阳性细胞调节RA-FLS的炎症过程。这提示以上信号通路可能在HBV和RA的发病机制中发挥重要作用。
5. 总结
综上所述,本研究鉴定了参与HBV和RA发病机制的关键基因和相关信号通路。这些基因和通路是否能够成为HBV合并RA新的生物标志物和潜在的靶点,仍需进一步研究。这不仅有利于HBV合并RA分子机制的研究,也为临床更准确地诊断和治疗提供参考。
基金项目
国家自然科学基金项目(项目编号:82272410,81972005)。
NOTES
*通讯作者。