基于“DeepSeek + 医疗”在线评论的情感分析
Sentiment Analysis of “DeepSeek + Healthcare” Online Reviews
摘要: 近年来,人工智能在医疗方面的应用越来越广泛,2025年1月掀起了国产大模型DeepSeek的热潮,全国多家医院陆续接入了DeepSeek技术,如西安国际医学中心医院,该技术的接入可以提升诊断效率及就医体验。随着DeepSeek大模型在医疗领域广泛部署,其应用效果引发关注,但针对用户情感态度与使用意愿的系统研究仍然缺乏。为此,本研究采用Python爬虫从抖音平台采集4000余条评论,经数据清洗和分词处理,使用TF-IDF提取文本特征,构建Transformer情感分析模型,并运用LDA模型提取评论主题。结果表明,评论情感以正面为主,多数用户认可“DeepSeek + 医疗”的诊断准确性与便利性,但少量负面评论涉及隐私、安全及AI可靠性顾虑。LDA分析识别出智能医疗、就医服务、医疗变革、诊疗方案四个主要主题。据此提出提高诊断精准度、优化用户界面和加强隐私保护等建议,以提升用户信任度和使用意愿。
Abstract: In recent years, the integration of artificial intelligence (AI) into the healthcare sector has advanced rapidly. In January 2025, the large domestic language model DeepSeek garnered widespread attention, with numerous hospitals across China—including Xi’an International Medical Center Hospital—successively adopting this technology. The implementation of DeepSeek has demonstrated the potential to enhance diagnostic efficiency and improve the overall patient experience. Despite its growing deployment, there remains a paucity of systematic research on user sentiment and adoption intentions related to this technology. To address this research gap, this study employed Python-based web scraping techniques to collect over 4,000 user comments from the TikTok platform. Following data cleaning and Chinese word segmentation, textual features were extracted using the Term Frequency–Inverse Document Frequency (TF-IDF) method. A transformer-based sentiment analysis model was then constructed to assess public sentiment, and a Latent Dirichlet Allocation (LDA) model was utilized to identify underlying thematic structures within the comments. Findings reveal that public sentiment is predominantly positive, with the majority of users expressing approval of the diagnostic accuracy and convenience offered by the “DeepSeek + healthcare” model. Nonetheless, a minority of negative comments reflect concerns pertaining to data privacy, system security, and the overall reliability of AI technologies. The LDA topic modeling identified four principal themes: intelligent healthcare, medical service delivery, healthcare transformation, and diagnostic strategies. Based on these insights, the study proposes targeted recommendations to enhance diagnostic precision, improve user interface design, and strengthen data privacy safeguards, thereby fostering greater user trust and increasing the willingness to adopt AI-driven healthcare solutions.
文章引用:曲兆悦. 基于“DeepSeek + 医疗”在线评论的情感分析[J]. 统计学与应用, 2025, 14(6): 103-115. https://doi.org/10.12677/sa.2025.146151

1. 研究背景

(一) 现实背景

2025年1月,国产大模型DeepSeek的应用爆增,随后各大医院纷纷将DeepSeek接入医疗系统。作为国内实现医疗场景部署的AI大模型,DeepSeek凭借其强大的数据处理能力和精准快速的回复,得到了广大用户的认可。近期已有多家医院接入DeepSeek。陕西省作为我国西部地区医疗创新的重要阵地之一,已经在今年二月份接入DeepSeek,进一步推动了“DeepSeek + 医疗”的“双向奔赴”。此外,DeepSeek等大模型还借助其特有的学习技术,助力医疗系统智能化,精准地服务了广大用户[1]

2025年2月,陕西省医疗系统迎来了DeepSeek的部署热潮。西安国际医学中心医院率先完成本地化部署,实现“数据不出院”的安全架构,成为智慧医院建设的标杆;咸阳市第一人民医院接入了DeepSeek,大大提升了工作效率;空军军医大学口腔医院发布了DeepSeek接入医疗的相关研究,证实DeepSeek在诊断中的准确率得到了有效提高。与此同时,湖南省多家医院也引入DeepSeek,实现智能化。这一趋势不仅反映了医疗机构对AI技术的需求,也展现了DeepSeek的广泛应用,加速推动医疗智能化。

医疗AI带来了便捷,但仍面临着巨大挑战。研究显示,约40%的医生认为AI的解释力度不足。尽管如此,行业共识正在形成——DeepSeek的价值不在于取代医生,而是通过AI辅助医生筛查常规病例,让医护人员工作更加便捷。如西安某三甲医院信息中心主任所言:“当AI承担70%的信息整理工作,医生便能专注于那30%真正需要人类智慧的判断。”这种人机协作模式,正重塑医疗效率与服务温度。

(二) 政策背景

近年来,我国正在积极推动人工智能在医疗健康领域的深度融合,将“互联网 + 医疗健康”和智能医疗作为优化医疗资源配置、推进健康中国建设的重要方向。自2015年以来,国务院及相关部门相继出台多项政策,为“DeepSeek + 医疗”发展提供了更加清晰的方向指引和健全的制度保障。

《国务院关于积极推进“互联网+”行动的指导意见》(国发〔2015〕40号)首次将“互联网 + 医疗”纳入国家战略,提出发展基于互联网的医疗卫生服务,推动健康大数据应用。2018年《国务院办公厅关于促进“互联网 + 医疗健康”发展的意见》(国办发〔2018〕26号)进一步细化政策路径,明确支持人工智能在医学影像、辅助诊断等领域的应用,并建立医疗数据互通共享机制,为AI医疗技术研发奠定数据基础。

《“十四五”国家健康信息化规划》(国家卫生健康委,2022)强调构建“三位一体”的智慧医院系统,要求二级以上医院普遍开展AI辅助诊疗应用,明确提出到2025年实现医疗健康AI核心技术创新突破。该规划将AI技术列为医疗信息化基础设施建设的重点领域,推动“DeepSeek + 医疗”等技术的临床落地场景拓展。

上海市人民政府办公厅近日印发《上海市发展医学人工智能工作方案(2025~2027年)》,加快推动人工智能在医疗领域的深度融合。上海正围绕前沿研究、智能康复服务、AI药物研发平台及医疗器械智能化等方向,打造全球医学人工智能创新高地。随着政策支持持续完善,算法突破与算力提升将进一步推动医疗健康产业高质量发展,如表1所示。

Table 1. Key policy documents related to the development of internet-based medical services

1. 涉及互联网医院诊疗发展的主要政策文件

文件名

文件号

发文时间

《国务院关于积极推进“互联网+”行动的指导意见》

国发(2015) 40号

2015年7月

《关于促进“互联网 + 医疗健康”发展的意见》

国办发(2018) 26号

2018年4月

《“十四五”国家健康信息化规划》

国家卫生健康委(2022)

2022年

《上海市关于推动人工智能大模型创新发展的若干措施》

工信部(2023)

2023年

《上海市发展医学人工智能工作方案(2025~2027年)》

上海市人民政府办公厅(2024)

2024年

《关于提升数字健康水平加快医疗AI应用的建议》

省卫生健康委员会(2024)

2024年

2. 调查目的

本次调查从新的视角去研究“DeepSeek + 医疗”的用户认知度、使用意愿及影响因素。研究结合各类分析方法,去挖掘提升用户“DeepSeek + 医疗”服务效能,进而提出优化建议。具体研究目标如下:

1) 了解用户对“DeepSeek + 医疗”认知度与使用意愿的影响。通过热门视频的评论数据采集用户的基本信息、他们对“DeepSeek + 医疗”的了解程度和技术接受度,以及用户的使用意愿。

2) 挖掘影响“DeepSeek + 医疗”服务效果的关键因素。结合用户反馈,从功能实用性、便捷性、信任度、隐私保护、操作体验、医疗辅助价值等多个维度评价,评估用户的信任度和安全性顾虑,找出影响大家是否愿意使用该服务的主要原因。

3) 评估用户对“DeepSeek + 医疗”的服务体验。通过调查,分析其在诊断准确度、数据隐私方面等方面的问题。同时,探讨用户的实际需求,为技术提升提供参考。

4) 根据用户反馈,提出改进方案,以提升使用体验、增强信任感、优化功能设计,推动“DeepSeek + 医疗”更广泛应用和发展。

3. 调查意义

(一) 理论意义

本研究围绕DeepSeek在医疗领域的应用,分析用户对“DeepSeek + 医疗”的使用意愿及影响因素。通过有序Probit模型框架,为医疗AI提供方法参考。相比那些侧重单一技术或从医护视角进行的研究,本研究从用户行为出发,构建了使用意愿的分析框架,为理解AI在医疗中的作用提供了新的思路与方法。

(二) 实践意义

通过实证分析,研究影响用户使用DeepSeek医疗服务的一些因素,如隐私安全、错误诊断等,并为医疗机构在接入AI技术时提供了建议。结果显示,简洁的界面、用户认知度有助于提高使用意愿。同时,研究为AI服务用户、降低风险、增强用户信任提供了相关支撑,也为政府和监管机构提供了一些建议,推动AI医疗的发展。

4. “DeepSeek + 医疗”在线评论数据来源及数据预处理

(一) 数据来源

本研究利用Python爬虫技术,借助DrissionPage自动化模块爬取了抖音平台上关于“DeepSeek + 医疗”热门视频的评论数据。爬取目标为点赞量较高的医疗主题视频,最终成功获取4000余条在线评论,涵盖评论者昵称、评论地区及评论内容,此数据为后续的情感分析与话题挖掘提供了丰富的数据支持。

(二) 数据预处理

1) 数据清洗

数据清洗是数据预处理的首要环节,也是保证分析质量的关键步骤。本研究对“DeepSeek + 医疗”相关的在线评论数据进行清理,去除了重复评论、空白评论及无效内容,确保数据的完整性和可靠性。经过筛选与整理,最终保留2706条与医疗相关的评论,还整理出只涉及人工智能讨论的视频评论共386条,通过清洗数据为后续分析提供了高质量的数据基础[2]

2) 文本数据分词

在完成数据清洗后,我们采用jieba分词工具对文本数据进行精确分词,以优化情感识别效果。其中,精确模式能最大程度地确保句子切分的准确性,从而提升文本分析的质量。为降低文本特征的复杂性并提高模型训练效率,我们进一步进行了停用词过滤,不仅整合了常见的中文停用词库,还针对研究需求扩充了医疗领域相关词汇,构建更具针对性的停用词表,并在训练过程中应用,以确保文本挖掘的精准性。表2展示了部分分词结果。

Table 2. Partial text data word segmentation results

2. 部分文本数据分词结果

原始句子

分词结果

我是个医生。看到这个以后,我很受到震撼。然后我根据手里的病人,介绍了几个病情交给DeepSeek。最后发现他给的治疗思路和我是几乎一样的。

医生 震撼 病人 介绍 病情 deepseek 发现 治疗 思路

我把我检查报告图片,加舌头图片,发给DeepSeek,他帮我分析病因,比医生讲两句详细得多,还我要吃什么食疗,药疗,不要熬夜,要做什么检查排除一些病,做什么康复运动能恢复身体。说得一清二楚。

检查报告 图片 deepseek 分析 病因 医生 详细 食疗 药疗 熬夜 排除 疾病 康复 恢复 身体

5. “DeepSeek + 医疗”特征分析

(一) “DeepSeek + 医疗”在线评论描述

图1中可以看出,大部分评论来自中国的不同省份,广东省的评论数量最多(838条),其次是江苏(529条)和山东(474条)。另外,国际地区(如英国、马来西亚、韩国等)也有一些评论,但数量相对较少。评论地区较高的几个地区基本都有医院接入了DeepSeek,并且平台的用户活跃度也较高,因此这些地区对DeepSeek + 医疗的讨论度会更高。综合地区数据,可以分析平台在不同区域的使用情况和活跃度,并识别潜在的扩展机会。

Figure 1. “DeepSeek + healthcare” comment address situation diagram

1. “DeepSeek + 医疗”评论地址情况图

(二) “DeepSeek + 医疗”在线评论词云图

近年来,医疗行业正经历AI和数据驱动的变革,词云分析图(图2)显示,公众对智能医疗、疾病治疗及就医体验的关注度较高,其中“DeepSeek”“AI”“治疗”等高频词反映出人们对医疗资源、智能诊断技术及治疗方案的讨论,而“人工智能”“数据”“指南”表明AI在疾病诊断、医疗决策和数据分析中的应用日益受到关注,同时,“问题”“看病”“方案”揭示了大众对优化医疗流程、提升就诊便利性的需求,此外,“疾病”“治疗”“药”显示医疗讨论的核心仍围绕诊疗展开,因此,如何优化医疗科技应用,真正提升患者体验,仍是未来发展的重要挑战。

Figure 2. “DeepSeek + healthcare” comment word cloud diagram

2. “DeepSeek + 医疗”评论词云图

6. 基于TF-IDF特征提取

(一) TF-IDF理论基础

文本中的高频词仅代表其出现次数较多,并不直接意味着该词在语义表达或信息传递中具有重要性[3]

词频(TF, Term Frequency)用于衡量特定词汇在文本中出现的频率。然而,为了防止某些高频词对分析结果造成偏差,需要对其进行归一化处理。此外,若某个词在整个语料库中频繁出现,其独特性和区分度往往较低,因此其重要性相对减弱[4]

t f i,j = n i,j k n k,j (4)

其中, n i,j 表示词语i在该文档j出现的次数, k n k,j 表示当前文章总词语数。 t f i,j 的值越大,词语i在文档j中出现的频率越高,重要性越大。

逆文档频率(IDF, Inverse Document Frequency)用于衡量词语在整个语料库中的重要性。若某个词在大多数文档中频繁出现,则其信息量较低,对文本区分度贡献较小;相反,若某个词仅在少数文档中出现,则其独特性较强,能够更有效地反映文档的特征,因此被赋予更高的权重。

id f i =log | D | | { j: t i d j } | (5)

其中, | D | 是语料库中的文档数, | { j: t i d j } | 是出现词语i的文档数。 id f i 的值越大,词语i越能体现部分文档的特征。

TF-IDF (Term Frequency-Inverse Document Frequency,词频–逆文档频率)是一种用于衡量词语在文档集合或语料库中重要性的统计方法,广泛应用于信息检索和文本挖掘。其核心思想是:若一个词在某篇文档中出现频率较高(TF高),且在其他文档中较少出现(IDF高),则该词对该文档具有较强的代表性,从而赋予其更高的权重,有助于提取关键特征,提高文本分析的精准度。

tfid f i,j =t f i,j ×id f i (6)

因此,当某个词在某篇文档中出现的频率较高,而在整个文档集合中出现的频率较低时,其权重就会相应增大,这表明该词能够更精准地反映该文档的核心内容,从而在文本分析和信息检索中具有更高的区分度和代表性。

(二) TF-IDF提取“DeepSeek + 医疗”在线评论特征

本文利用Python提取关键词及其对应的TF-IDF权重值,以构建新能源用户对“DeepSeek + 医疗”的满意度评估模型。筛选出的关键词应能有效反映用户最关注的核心属性。表3展示了计算得到TF-IDF值较高的名词。

Table 3. TF-IDF values of feature words

3. 特征词TF-IDF值

特征词

tfidf值

特征词

TF-IDF值

医生

0.0947

问题

0.0132

deepseek

0.0687

医疗

0.0128

医院

0.0482

取代

0.0128

ai

0.0460

替代

0.0125

看病

0.0340

做手术

0.0120

续表

治疗

0.0215

报告

0.0118

病人

0.0209

症状

0.0114

方案

0.0166

人工智能

0.0109

开药

0.0153

患者

0.0102

百度

0.0142

病情

0.0096

西医

0.0141

手术

0.0086

诊断

0.0140

指南

0.0084

疾病

0.0137

相信

0.0080

TF-IDF通过过滤掉高频但不重要的词汇,保留对文档内容具有关键影响的词语。综合表3的TF-IDF值来看,医疗讨论的核心集中在“医生”、“医院”、“AI”、“医疗”及“就医体验”。其中,“deepseek”与“AI”具有较高权重,反映出智能医疗是关注重点,涉及人工智能辅助诊断与医疗数据分析。同时,“治疗”、“诊断”、“方案”等词表明公众对疾病治疗和医疗手段的关注,而“开药”、“做手术”,则强调了医疗行为的重要性。此外,“人工智能”、“症状”、“指南”等词尽管权重较低,但仍体现AI医疗、症状识别及医疗指导的影响力。整体来看,医疗科技发展与患者就医体验是公众讨论的核心话题。

7. “DeepSeek + 医疗”在线评论情感分析

(一) 文本情感分析的方法

由于医疗评论中的词汇如“病”“痛”等字易导致情感分类模型误判负面情感,本文选择自行训练模型以提升分类效果,并采用Snorkel进行弱监督数据标注,以减少人工标注成本。Snorkel通过标注函数自动推测数据类别,而非依赖大规模人工标注。为提高标注准确率,本文引入医疗专有词汇优化Snorkel规则,确保标注更符合医疗语境。同时也根据标注结果进行人工调整,增加情感词汇,保证情感标注的准确性。

通过Snorkel和人工调整,得到标注文本如表4所示:可以看到标签通过调整后分类基本正确。

Table 4. DeepSeek + healthcare online comment sentiment labeling table

4. DeepSeek + 医疗在线评论情感标注表

评论

情感标签

不要质疑,真的准,与主任医师说的一样。双重求证,心里瞬间踏实了

正面

我之前把检查单给deepseek,它说我是良性瘤医生说我就是炎症而已

负面

病人:我百度~,医生:等等 病人:我deepseek~,医生:等等~

中性

我们三线城市,我老婆在的医院都已经接入deepseek了。赶紧叫你们医院跟上时代吧

正面

我把我鼻窦炎的病情说了,和我们这很有名的医院的专家说的大差不大,还看出我治疗信心不强,不想手术,安抚了我的情绪,还分析了治愈率和手术概率

正面

deepseek代替不了医生,病情是变化的,deepseek是死的

负面

(二) 运用深度学习模型进行情感分析

使用基于Transformer的深度学习模型来进行医疗评论的情感分类,该模型结合了词嵌入、Transformer编码层、全连接层等组件,通过端到端学习自动提取文本的情感特征,并最终分类为正面、中性或负面。同时使用滑动窗口处理长文本,能有效避免信息丢失,提高情感分类的完整性。

通过基于Transformer的深度学习模型进行医学情感分类,模型达到了准确率81.73%,精确率81.81%,召回率81.73%,F1-Score 81.75%,表明模型在情感分类任务中具有较高的鲁棒性和稳定性,能够有效区分正面、中性和负面情感。

Figure 3. ROC curve of “DeepSeek + healthcare” sentiment classification

3. “DeepSeek + 医疗”情感分类ROC曲线

同时由图3,可以看出来模型整体AUC值在0.80以上,说明分类效果较好,因此该模型整体性能良好,能够更准确地适应医疗领域的特殊文本表达,为后续医疗情感分析研究提供了可靠的技术支持。

Figure 4. Confusion matrix of “DeepSeek + healthcare” sentiment classification

4. “DeepSeek + 医疗”情感分类混淆矩阵

Table 5. Sentiment classification report for “DeepSeek + healthcare”

5. “DeepSeek + 医疗”情感分类报告

精确率

召回率

f1-score

负面

0.83

0.85

0.84

中性

0.73

0.74

0.74

正面

0.85

0.82

0.84

图4表5的结果看,模型整体表现良好,准确率82%,F1分数均超过0.8,说明模型在“DeepSeek + 医疗”情感分析中的分类能力较强。因此接下来使用该模型进行情感分类,得到图5

Figure 5. Sentiment distribution chart of “DeepSeek + healthcare”

5. “DeepSeek + 医疗”情感分布图

图5中可以看出,“DeepSeek + 医疗”评论的整体情感分布趋向于积极,正面评价占比最高,说明大部分用户对其持认可态度。在用户评论中,正面评论主要集中在相较传统诊断,“DeepSeek + 医疗”的精准度及便利程度更高一点。与此同时,负面评论仍占一定比例,这表明部分用户在使用过程中仍然存在不满。总之,“DeepSeek + 医疗”的整体口碑较好,用户对其技术和专业能力有较高认可度[5]

8. 基于LDA模型确定主题数

(一) LDA模型理论基础

LDA (Latent Dirichlet Allocation,潜在狄利克雷分配)由Blei, David M.、Ng, Andrew Y.、Jorda于2003年提出,用于推测文档的主题分布。该模型假设每篇文档由多个主题组成,每个主题由一组词汇以不同概率构成。LDA通过概率分布表示文档的主题结构,在分析大量文档后提取核心主题,从而实现主题聚类与文本分类,广泛应用于文本挖掘、信息检索、推荐系统等领域[6]

LDA (Latent Dirichlet Allocation)模型的原理可以从生成过程、参数估计和推断三个方面来理解:LDA模型基于生成模型,即假设每篇文档都是由若干个主题混合生成的,并且每个主题又由若干个单词混合生成的。具体来说,LDA模型假设有K个主题,每个主题包含了一组单词分布。对于每篇文档,先从主题分布中随机选择一个主题,然后根据该主题的单词分布随机选择一个单词,并重复该过程直到生成完整篇文档;参数估计:LDA模型的参数估计可以通过最大似然估计或贝叶斯估计等方法进行[7]。具体来说,需要对每篇文档中每个单词的主题进行估计,以及对每个主题中每个单词的概率分布进行估计。其中,估计文档中每个单词的主题可以通过Gibbs采样或变分推断等方法进行,而估计主题中每个单词的概率分布则可以通过矩阵分解等方法进行;推断:在LDA模型中,推断指的是对于给定的文档,估计其主题分布。通常可以使用Gibbs采样或变分推断等方法进行推断。具体来说,对于给定的文档,可以通过先验分布和文档中单词的分布推断出其主题分布,从而得到文档的主题表示[8]

(二) LDA确定“DeepSeek + 医疗”在线评论的主题数

“DeepSeek + 医疗”评论的LDA主题特征分析

本文采用TF-IDF生成的词向量矩阵构建 LDA 模型,并在模型训练完成后,通过困惑度曲线确定最佳主题数。图6展示了“DeepSeek + 医疗”在线评论的困惑度情况。由图可见,当主题数为4时,困惑度达到较低水平,表明该主题划分较为合理,有助于更准确地提取评论中的核心话题[9]

Figure 6. Topic perplexity of user positive reviews for “DeepSeek + healthcare”

6. 用户满意评论的主题困惑度

本文利用Python中的LdaModel进行主题建模,并使用pyLDAvis进行LDA结果可视化,最终获得用户满意评论的LDA可视化结果(如图7所示)。从图中可以观察到,四个主题的圆形面积相近,并在坐标系中均匀分布,表明主题之间的区分度较高。结合困惑度分析,可确定用户满意评论的最佳主题数为4,从而确保主题划分的合理性和语义清晰度。

Figure 7. Visualization of topic model for user positive reviews when the number of topics is 4

7. 主题数为4时用户满意评论主题模型可视化

最终分析“DeepSeek + 医疗”在线评论后,得到四个主要主题(如表6所示)。智能医疗:AI在医疗领域的应用成为热议话题,DeepSeek及AI诊断技术受到关注,公众对AI赋能医疗充满期待,但同时也对其可靠性持观望态度。因此,AI研发机构应加强技术透明度,提供高可信度的应用方案,增强用户信任。就医服务:患者就医体验成为讨论焦点,涉及看病流程、医院服务、医生沟通等方面,反映出公众对医疗质量的高度关注。优化医患沟通机制,提高服务质量,有助于改善患者体验,减少医疗纠纷。医疗变革:AI是否会取代医生引发热议,尽管AI在辅助诊断方面展现出巨大潜力,但公众普遍对其完全取代医生持谨慎态度。因此,应明确AI在医疗中的辅助角色,推动AI + 医生协作模式,以提高诊断效率,同时确保医疗决策的可靠性。诊疗方案:讨论主要围绕疾病诊断、治疗方法及药物使用,显示出公众对科学合理的治疗方案的关注。医疗机构应加强健康科普,提供权威医疗指南,避免错误信息误导患者,提升公众健康认知水平[10]

Table 6. Features of topics in user positive reviews

6. 用户满意评论主题特征

类别

主题

特征词

第一类

智能医疗

DeepSeek、AI、医疗、医院、诊断、数据、人工智能、机器、软件、智能、科技、方案、精准、诊疗

第二类

就医服务

医生、患者、看病、病人、门诊、挂号、问诊、住院、病情、治病、医患、体检、检查报告、建议

第三类

医疗变革

取代、替代、庸医、经验、医学知识、判断、准确率、外科、内科医生、机器人手术、医学专家

第四类

诊疗方案

诊断、治疗、手术、开药、药物、处方、中药、西医、癌症、验血、拍片、分析、健康指标、用药建议

基于研究数据分析,本研究提出以下针对性优化建议,以提升“DeepSeek + 医疗”的用户接受度和市场竞争力。

9. 建议

(一) 提高诊断精准度,增强价值感

优化DeepSeek诊断算法,利用更多高质量医学数据进行训练,提升疾病识别能力,降低误诊率,提高问诊结果的参考价值;强化模型医学知识库,增强对罕见病和慢性病的学习能力,为用户提供更全面的诊断支持;提升问诊解释能力,增加诊断可信度评估和详细解读,帮助用户理解诊断依据,增强信任感;结合用户反馈,建立持续优化机制,不断改进诊断质量,使其更符合临床需求。

在现有基础上,可与多家三级医院建立数据合作,获取经过严格脱敏处理的病历、影像和问诊记录,用于对Transformer模型进行增量训练与微调;同时,结合权威医学知识图谱,完善模型的专业词汇与诊疗知识库,特别是对罕见病和慢性病场景做专项标注;在系统输出中增加诊断置信度和依据摘要,帮助用户直观了解模型判断的逻辑;并通过线上反馈机制(如问卷或聊天机器人)定期收集用户对诊断结果的评价,将真实反馈融入后续迭代,形成闭环优化,持续提升模型对临床需求的贴合度。

(二) 强化医院和企业端的推广,提高组织支持

推动医疗机构合作,鼓励公立医院、私立医院和社区诊所采用“DeepSeek + 医疗”,通过医生的认可增强患者信心。制定行业标准,联合行业协会和政府机构,推动“DeepSeek + 医疗”应用规范化,提高医疗机构的接受度。推动企业内部应用,将其用于企业健康管理和员工福利,提升企业对AI诊断的信任。争取政策支持,推动政府将“DeepSeek + 医疗”纳入医保支付体系,提高医疗机构的采纳积极性。

建议先在1~2家三级甲等公立医院设立“DeepSeek诊疗示范点”,由院内专家定期评估并公开成效报告,以医生认可带动患者信任;同时牵头成立行业联盟,联合医疗协会和监管部门,共同制定AI辅助诊疗应用规范,定期举办研讨会和培训,推动标准化落地;在企业健康管理领域,可与大型企业HR或保险机构合作,将DeepSeek嵌入员工健康平台,为员工提供在线问诊与健康报告,借助企业背书扩大用户基础;最后,组织临床与经济评估团队,向医保部门提交研究报告,为将AI诊疗纳入医保支付体系做好准备。

(三) 优化用户界面设计,提升易用性

提升人机交互体验,采用更直观的UI设计,使操作更简单、用户更容易理解“D医生”诊断的工作流程;提供多语言、多模式支持,满足不同用户群体需求,包括语音问诊、图像识别等多模态交互方式;强化用户引导,增加可视化解读、健康数据跟踪功能,让用户更容易获取有用信息。

在用户端界面上,应将注册、信息填写、问诊和报告查看等环节整合为“登录→提交症状→查看结果”三步式流程,并在关键节点提供清晰的图标和操作指引;引入语音识别与图像上传功能,支持用户通过语音描述病情或上传X光、CT图片,实现多模态交互;在诊断结果页增加可视化流程图和动态健康档案仪表盘,让用户一目了然地跟踪诊疗进度与健康趋势;同时根据用户反馈,不断优化交互细节和语言表达,使界面更贴近不同年龄层和文化背景的使用习惯。

(四) 加强数据安全和隐私保护,消除用户顾虑

提升隐私政策透明度,清晰说明AI诊疗过程中数据的使用方式,增强用户对数据安全的信任。建立严格的数据保护机制,采用端到端加密、联邦学习等技术,防止数据被滥用或泄露。确保符合《数据安全法》《个人信息保护法》等法规要求,提升平台的合规性。

在隐私政策方面,应在App与官网显著位置公布《数据使用与隐私保护声明》,并通过交互式页面详细说明数据收集、存储、使用和销毁流程;在技术层面,全链路启用TLS 1.3与AES-256加密,确保数据在传输和存储环节的安全;探索与合作医院开展联邦学习试点,将模型训练和更新控制在本地系统,仅交换模型梯度,有效避免原始数据出框;并定期邀请第三方安全评估机构进行渗透测试和合规审计,公开审计报告,以透明、专业的方式增强用户及监管部门的信任。

参考文献

[1] 闾海荣, 江瑞, 张学工, 等. DeepSeek与医学大语言模型: 技术创新与医疗服务模式重构[J]. 医学信息学杂志, 2025, 46(2): 1-7+13.
[2] 冯海, 马甲林, 许林杰, 等. 融合标签嵌入和知识感知的多标签文本分类方法[J]. 南京大学学报(自然科学), 2023, 59(2): 273-281.
[3] 黄春梅, 王松磊. 基于词袋模型和TF-IDF的短文本分类研究[J]. 软件工程, 2020, 23(3): 1-3.
[4] 常冬雨. 高校智能财务审计系统构建研究[J]. 财会讯, 2021(17): 147-151.
[5] 朱益平, 慕钰, 孙逸宁. ChatGPT大语言模型的评论情感分类预测与主题识别研究[J/OL]. 情报科学, 1-35.
https://kns.cnki.net/kcms2/article/abstract?v=SyD34uTtguCt6KGLBC0lIL8cZh7WpFeRL1YR7Hl6hTuqiePKVA7rnV771S9C1U36uEp8TzgVhVemrqTKKV6_UYhrepmU0cqqzgPBBdBxRaX2vjcZOza7ACsMnPXq29Sce4plTgSEf2F286OXj_LvAmc0LXGGzo9mxzo84shBYZ_AoQV58ksoNf6AhyW9zohZyTU-1vVBjCU=&uniplatform=NZKPT, 2025-03-11.
[6] 马景楠, 毛春. ChatGPT用户接受和使用意愿影响因素研究——基于TAM和TTF整合视角[J]. 科技传播, 2024, 16(17): 118-124.
[7] Blei, D.M., Ng, A.Y. and Jordan, M.L. (2003) Latent Dirichlet Allocation. The Journal of Machine Learning Research, 3, 993-1002.
[8] 高慧颖, 刘嘉唯, 杨淑昕. 基于改进LDA的在线医疗评论主题挖掘[J]. 北京理工大学学报, 2019, 39(4): 427-434.
[9] 孙辛欣, 孙亚楠, 赵宇翔, 等. AI医疗语音助手声音特征对老年人感知可信度和使用意愿的影响研究[J/OL]. 数据分析与知识发现, 1-18.
https://kns.cnki.net/kcms2/article/abstract?v=a4fp6zKrpgZcKeb1ySGwmI8Kfk9bDzuqrnWZqtZMnjkPyYQBzTBDiXNiDA4X2T42k0266FSV5DrrJoeuwHLG2q2mgfmdyr0Gn9KC_1ZQqix8jtxSkCCgHicey57uXs7x_nGxbtaPaXDZEoD3IMD9pnRn7opvBMEMTDVqjWqKT_aIZhibRtcWqA==&uniplatform=NZKPT&language=CHS, 2025-03-11.
[10] 张海, 刘畅, 王东波, 等. ChatGPT用户使用意愿影响因素研究[J]. 情报理论与实践, 2023, 46(4): 15-22.