摘要: 目的:研究人工智能(AI)辅助低剂量CT联合多种肿瘤标志物在社区体检人群中肺癌机会性筛查的应用价值。方法:回顾性分析2023年1月~2024年12月间在本院经LDCT检查表现为肺结节的患者80例,且所有患者均进行过4种肺癌肿瘤标记物(SCC、CEA、Cyfra21-1及NSE)检测,以病理结果为金标准,通过对比分析各组对肺结节良恶性诊断的准确性、敏感性、特异性等,分析不同诊断方式的价值。结果:80例经病理诊断显示恶性结节63个,良性结节17个,人工智能系统(AI)辅助 + 医师诊断组 + 联合肿瘤标志物诊断组诊断肺癌的准确率为97.5%,灵敏度为98.4%,特异度为94.1%,高于其他两组,而漏诊率为1.6%,误诊率为5.9%,均低于其他两组,差异有统计学意义(P < 0.05),此方法优于传统方法,能够在早期发现更多的潜在病例。AI辅助 + 医师诊断组的平均阅片时间为(167 ± 45) s短于其他两组,差异有统计学意义(P < 0.05)。肺癌组的血清肿瘤标志物水平高于良性病变组,差异有统计学意义(P < 0.05)。结论:人工智能(AI)辅助低剂量CT联合肿瘤标志物在社区体检人群肺癌机会性筛查中检出率、灵敏度、特异度及准确率均较高,且诊断准确率与病理结果一致性较高,可作为临床筛查肺结节的常规手段。
Abstract: Objective: To investigate the application value of artificial intelligence (AI) assisted low-dose CT combined with multiple tumor markers in screening for lung cancer in community physical examination population. Method: A retrospective analysis was conducted on 80 patients who presented with pulmonary nodules on LDCT examination in our hospital from January 2023 to December 2024. All patients underwent testing for four lung cancer tumor markers (SCC, CEA, Cyfra21-1, and NSE), with pathological results as the gold standard. The accuracy, sensitivity, and specificity of each group in the diagnosis of benign and malignant pulmonary nodules were compared and analyzed, and the value of different diagnostic methods was analyzed. Result: Pathological diagnosis showed 63 malignant nodules and 17 benign nodules in 80 cases. The accuracy, sensitivity, and specificity of the artificial intelligence system (AI) assisted physician diagnosis group combined with tumor marker diagnosis group for diagnosing lung cancer were 97.5%, 98.4%, and 94.1%, higher than the other two groups. However, the missed diagnosis rate was 1.6% and the misdiagnosis rate was 5.9%, both lower than the other two groups, with statistical significance (P < 0.05). This method is superior to traditional methods and can detect more potential diseases in the early stage. The average reading time of the AI assisted + physician diagnosis group was (167 ± 45) seconds, which was shorter than the other two groups, and the difference was statistically significant (P < 0.05). The serum tumor marker levels in the lung cancer group were higher than those in the benign lesion group, and the difference was statistically significant (P < 0.05). Conclusion: Artificial intelligence (AI) assisted low-dose CT combined with tumor markers has a high detection rate, sensitivity, specificity, and accuracy in the screening of lung cancer opportunities in community physical examination populations. The diagnostic accuracy is consistent with pathological results, and can be used as a routine method for clinical screening of lung nodules.
1. 引言
随着我国经济高速发展及不可避免的环境质量下降,肺癌在我国乃至全球其发病率和死亡率都位居前列,而其五年生存率还不足20% [1]。肺癌的主要影像学的表现是肺结节,在临床实践中,低剂量CT检查(Low dose CT, LDCT)不仅能在降低放射剂量的同时最大程度保证图像质量,而且可以薄层重建,是一种易获取、低辐射、小成本、高耐受检测肺结节病变的至关重要手段和方法[2] [3]。随着人工智能(artificial intelligence, AI)在各级医院逐渐普及,关于LDCT联合血清肿瘤标志物对老年体检人群肺癌早期筛查的应用并不多见,本研究尝试分析人工智能(AI)辅助低剂量CT联合4种肺癌肿瘤标记物[鳞状细胞抗原SCC]、神经元特异性烯醇化酶(NSE)、细胞角质蛋白细胞角蛋白19片段(cytokeratin 19 fragment, CYFRA21-1) Cyfra21-1及癌胚抗原(CEA)]在体检人群肺结节筛查中的应用价值。
2. 资料与方法
2.1. 临床资料
选取2023年1月至2024年1本院LDCT表现为肺结节的患者80例孤立性肺结节患者作为研究对象,分为医师诊断组(下称1组)、AI辅助+医师诊断组(下称2组),AI辅助 + 医师诊断组 + 联合肿瘤标志物诊断组,(下称3组)分析各组差异。纳入标准:(1) 有可测量的肺部结节,并经后续病理检查确定结节性质;(2) 符合CT检查适应证;(3) 临床资料完整;(4) 研究内容已告知患者及家属并获取同意。排除标准:① 有其他恶性肿瘤病史,既往接受过肺部手术、放疗或化疗者;② 图像质量差,无法提供清晰、准确的结节信息。③ 存在其他系统性肿瘤或明显感染性疾病。本研究已经医院伦理委员会审批同意,入选者均签订知情同意书。
2.2. 方法
1. 多层CT检查(MSCT)。选取GE64排螺旋CT扫描机,扫描时患者采用仰卧位,头先进,采用深吸气后屏气连续扫描,扫描范围胸廓入口至双肾上缘,保证包含双肺全部。采用标准算法及高分辨算法进行重建并且将扫描原始数据上传至影像工作站进行阅片。完成胸部CT检查后,由2名经验丰富的影像科医师进行审片,对于肺结节的发生情况做出诊断。同时应用人工智能辅助诊断系统进行阅片,判断肺结节的发生情况。
2. 图像分析。应用AI辅助分析软件InferRead CTR12.2,由北京推想医疗科技股份有限公司提供。将原始图像导入系统软件将自动识别并标记结节病灶,给出肺结节位置、大小、性质等准确信息,同时模型根据这些信息计算恶性概率预测值,当恶性概率预测值 > 70%时判断为恶性结节。
3. 所有参与受试者空腹采取外周静脉血5 mL,离心分离血清后,检测人SCC、CEA、Cyfra21-1及NSE,应用全自动电化学发光免疫分析仪进行检测,所有操作均严格按照仪器及试剂的说明书进行。正常参考值是根据健康人群测定值及试剂盒所推荐的正常值确定:CEA < 5.0 ng/mL、SCC < 1.8 ng/mL、Cyfra21-1 < 3.3 ng/ml,NSE < 16.3 ng/ml,超出参考范围为阳性,即判断恶性;联合检测时其中一项为阳性即判断为阳性。
2.3. 数据处理(
)
采用统计学软件SPSS21.0处理数据,计量资料以(
)描述,计数资料用n (%)表示,比较采用卡方检验或Fisher精确概率法,两组间比较采用独立样本t检验,P < 0.05为差异有统计学意义。
3. 结果
3.1. 不同方式的检查所用时间
AI辅助 + 医师诊断组的平均的阅片时间为(167 ± 45) s短于其他两组,差异有统计学意义(P < 0.05),见表1。
3.2. 不同方式的检查结果
所选80例患者均经手术病理确诊,病理结果显示恶性结节63个,良性结节17个。1组准确诊断恶性结节37例,准确诊断良性结节9例。2组准确诊断恶性结节45例,准确诊断良性结节11例。3组准确诊断恶性结节62例,准确诊断良性结节16例。3组诊断肺癌的准确率为97.5%,灵敏度为98.4%,特异度为94.1%,高于其他两组,而漏诊率为1.6%,误诊率为5.9%均低于其他两组,差异有统计学意义(P < 0.05),见表2。
3.3. 病理检查良性、恶性者血清肿瘤标志物水平的结果
恶性组的血清肿瘤标志物水平高于良性病变组,结果有统计学意义(P < 0.05),见表3。
Table 1. Comparison of average testing time among three groups (
)
表1. 三组检测平均时间比较(
)
检查方式 |
例数 |
平均阅片时间 |
t |
P |
1组 |
80 |
402 ± 56 |
64.2 |
0.001 |
2组 |
80 |
167 ± 45 |
33.1 |
0.001 |
3组 |
80 |
603 ± 69 |
78.1 |
0.001 |
Table 2. Comparison of diagnostic efficiency of different diagnostic modes [% (n/m)]
表2. 不同诊断模式诊断效能比较[% (n/m))]
检查方案 |
灵敏度 |
特异度 |
准确率 |
漏诊率 |
误诊率 |
1组 |
58.7 (37/63) |
52.9 (9/17) |
57.5 (46/80) |
41.3 (26/63) |
47.1 (8/17) |
2组 |
71.4 (45/63) |
64.7 (11/17)) |
70 (56/80) |
28.6 (18/63) |
35.3 (6/17) |
3组 |
98.4 (62/63) |
94.1 (16/17)) |
97.5 (78/80) |
1.6 (1/63) |
5.9 (1/17) |
z |
−3.755 |
−2.091 |
−2.652 |
5.585 |
2.532 |
P |
0.001 |
0.037 |
0.008 |
0.001 |
0.001 |
Table 3. Comparison of serum biomarkers between lung cancer group and benign group (
, ng/mL)
表3. 肺癌组与良性组血清标志物比较(
, ng/mL)
组别 |
肺癌组 |
良性组 |
t |
P |
CEA (ng/mL) |
67.3 ± 2.77 |
4.76 ± 0.73 |
27.146 |
0.000 |
NSE (ng/ml) |
78.5 ± 5.34 |
15.4 ± 1.93 |
50.16 |
0.000 |
SCC (ng/mL) |
37.2 ± 3.45 |
3.1 ± 0.88 |
26.69 |
0.000 |
Cyfra21-1 (ng/ml) |
19.7 ± 1.67 |
2.9 ± 0.62 |
113.88 |
0.000 |
CEA < 5.0 ng/L, SCC < 1.8 ng/L, Cyfra21-1 < 3.3 ng/ml, NSE < ng/ml.
4. 讨论
我国肺癌高发病率和高死亡率使肺癌早期诊断与治疗对于挽救患者生命变得至关重要,肺癌防治俨然成为健康中国战略至关重要一环。肺癌的主要表现即肺部结节,以往病理组织活检被认为是诊断肺癌的金标准,但其具有侵入性、高风险和价格昂贵等缺点,因此不利于肺癌早期筛查,肺结节通过体检窗口可早期发现,应用LDCT对肺癌的筛查及早期诊断和治疗已被公认为是癌症防控最有效的措施[4] [5]。但在肺癌筛查时因检查图像数量多、受阅片者主观经验和疲劳的影响和诊断医师数量及肺结节无法定性等问题日益凸显[6],现在多采用人工智能(artificial intelligence, AI)辅助诊断技术阅片,通过使用计算机提取和分类算法,AI具有深度学习能力及强大图片识别功能擅长识别图像中的复杂模式,自动学习图像的特征、信息,可将图像分析从主观、定性的任务转为客观、定量的任务。其中肺结节筛查系统凭借其能高效利用影像学图像,为筛查肺癌、组织病理评估、疗效检测、预后评估、个体化治疗方案等方面提供更多有价值的信息[7] [8],实现精准诊疗,它不但提高了医生的工作效率和准确性,同时大大降低了肺结节的漏诊率、误诊率[9],但是AI存在无法准确定性肺结节、生物学信息反映不全面、训练数据集质量不一、标注质量欠缺、图像处理技术缺乏统一标准等不足[10],临床上多采用肿瘤标志物协同筛查肺癌。血清肿瘤标志物是机体在应对肿瘤细胞的生长增殖过程中产生的物质,参与肿瘤的发生发展全过程[11],操作方法廉价、简单且可动态检测,可以为癌症早期筛查和诊断、预后和疗效监测、恶性程度、分化程度、监测肿瘤的复发或转移等方面提供重要依据[12] [13],进而评估患者的生存期和疾病进展,利于个体化治疗方案的制定[14]。基于蛋白质的肿瘤标志物单独应用于肺癌早期诊断敏感性和特异性较低,然而SCC、NSE、Cyfra21-1、CEA联合检测诊断肺癌的敏感度可达96.4%,特异性可达85%,在为病理诊断提供信息的同时也为临床治愈提供了重要的指导意义[15] [16]。本研究证实AI辅助 + 医师诊断组 + 联合肿瘤标志物诊断组在肺癌筛查中广泛应用并弥补了人为操作可能带来的误差、提高诊断肺癌的工作效率,能够提高肺癌诊断的准确度、特异度和敏感度,降低误诊率和漏诊率。这4项指标联合检测可以优势互补,其诊断效能优于单项检测,这与王莹、李丰章、凌云志等人的研究[15] [16]一致。本研究探讨了当前医学影像诊断领域的热点问题,即如何利用新兴技术提高肺癌早期筛查的效率和准确性。研究的意义在于尝试整合三种不同的诊断工具——医师经验、AI算法和血清生物标志物,以构建一个多维度的诊断模型,旨在克服单一方法的局限性。其创新性主要体现在应用层面,即将这套组合方案应用于“社区体检人群的机会性筛查”这一特定场景,为解决基层或体检中心面临的大量LDCT影像判读压力和诊断不确定性问题提供了实践数据和一种可行的解决方案。
本研究仍然具有一定局限性,因为分析样本量较小,且采用的是回顾性设计,加之统计学方法的选择性偏倚等问题,可能对本研究结果产生一定的误差。
综上所述,本研究表明,人工智能(AI)辅助低剂量CT联合肿瘤标志物的联合检测能提高肺癌诊断的准确度,具有较高的临床应用价值,值得大力推广和临床应用。
基金项目
丽水市莲都区科技局科研项目(莲科[2023] 30号编号2023-12)。
NOTES
*第一作者。