1. 引言
随着技术的快速更迭与媒介形态的不断演化,人工智能(Artificial Intelligence, AI)已成为深刻重塑传播格局的重要力量。从新闻采编到内容分发,从舆情分析到用户交互,AI技术正以前所未有的速度渗透到信息传播的各个环节之中。“人如何与媒介互动”这一传播学研究的核心问题在AI时代获得了新的内涵:用户不再只是被动的接受者或简单的使用者,而是与具备学习、预测和生成能力的智能系统进行持续、动态的互动。这种互动关系重新定义了媒介使用的边界,也对传播过程、传播效果乃至传播伦理提出了新的挑战。
在传统传播理论框架中,媒介被视为信息的载体或渠道,用户行为多被归纳为接受、选择、反馈等过程。然而,在AI驱动的媒介生态中,用户与技术之间的边界逐渐模糊。AI不仅能识别用户偏好、预测行为,还能通过自然语言生成与情感计算和用户进行拟社会式互动。在这一过程中,用户与AI之间的关系从使用关系转变为共生关系,其互动既具有工具性功能,也包含情感性与社会性维度[1]。因此,理解AI时代的传播行为,需要超越技术应用层面,深入探讨用户与AI之间的意义建构过程。
在人工智能技术日益渗透进社会生活的背景下,用户与AI的互动实践呈现出多样化和复杂化的趋势。除ChatGPT、DeepSeek、Kimi等广为人知的生成式AI外,各类AI写作助手、语音助手、图像生成工具已广泛嵌入用户的日常生活中,成为人机互动的新场景。与此相应,网络社区中出现了以AI使用经验分享与意义探讨为核心的讨论空间。豆瓣小组“今天和AI互动了吗”正是此类新兴的数字实践社群之一。作为一个自发形成的在线公共讨论空间,该小组聚集了大量关注AI技术的用户,成员们通过发帖、评论等方式,分享他们与AI互动的使用经验,讨论AI的潜能、局限与伦理议题。通过分析该豆瓣小组中的讨论内容,可以有效捕捉用户与AI互动的多维度特征。相较于专业科技媒体或官方报道,这类草根式的网络社区提供了一个观察用户如何在社会文化语境中理解和驯化AI的重要窗口。
基于此,本文以豆瓣小组“今天和AI互动了吗”为研究对象,结合自然语言处理技术分析用户与AI互动的主题和情感特征,进而揭示用户与AI互动的动机、态度以及情感体验。具体而言,本研究采用LDA主题模型对小组讨论内容进行主题挖掘,以识别用户在讨论中关注的核心议题;同时运用情感分析方法,揭示用户在AI互动中的情绪倾向与态度表达。
2. 文献综述
(一) 使用AI的动机
使用与满足理论是一种解释用户选择和使用媒体技术动机的理论框架[2],是传播学领域的经典理论之一。该理论以用户为中心,假定用户在主动选择媒介的过程中,试图从媒介中获得认知、情感、社会或个人整合等多重满足[3]。随着互联网与移动通信技术的兴起,学者们逐渐将该理论延伸至新媒体情境,探讨用户如何通过社交平台、视频应用或游戏化环境满足其认知、娱乐与社交需求[4]。
这一理论的灵活性在人工智能时代再次展现出生命力。与传统媒介相比,AI的交互性、生成性与拟人化特征使其不仅是一种信息工具,更成为一种可回应的传播主体。近年来,社会科学研究者运用该理论研究了驱使人们使用人工智能并与人工智能技术进行交互的动机。首先,是工具性或功能性动机,人工智能可以通过提高某些工作任务的效率和生产力来满足用户的实用需求[5],例如AI助手可以帮助用户快速完成拨打电话、设置日历条目等日常活动,也可以为用户提供新闻和信息、自动生成文本。其次,用户可以将AI作为情绪调节与休闲娱乐的对象,甚至通过与AI互动逃避现实[6]。再次,AI的拟人化特征使其逐渐成为新的社会交往对象,与AI的交流可以满足用户的社交需求[7]。“计算机即社会行为者”理论指出,人们往往无意识地将与计算机的互动视为与他人交往的延伸,进而赋予其社会意义与情感回应[8]。当用户认为AI具有社会吸引力并与其建立社会关系时,他们更倾向于信任AI的建议,并表现出类似人际关系中的依赖行为;用户甚至可能将AI视为替代朋友或伴侣的社会行动者,在互动中寻求情感共鸣与社会慰藉[9]。
总之,过往研究已经探讨了用户与AI互动的动机。然而,现有研究仍存在若干局限:第一,大多研究采用问卷调查方法,依赖于自我报告数据,可能忽视了用户在真实语境中对AI互动的自然表达。第二,这些研究往往聚焦于特定的应用场景,缺乏对跨场景、跨文化的用户体验。第三,学界较少探讨用户如何在社会化平台中集体讨论和协商AI使用。因此,本文将视角转向在线实践社区,从集体话语与情感表达入手,捕捉匿名论坛中与AI互动有关的主题。
(二) 基于AI的在线实践社区
实践社区指的是拥有相似身份和共同兴趣的一群人通过持续的沟通交流增加自己在该领域的知识和技能[10]。随着社交媒体的发展,实践社区逐渐转向线上形态。在线实践社区是指通过社交网络平台自发建立和维持的自组织性、去中心化和开放性的社区,成员通过文本、图像、链接等多模态方式进行交流与知识共享[11]。社交媒体的算法推荐机制使用户能更容易地找到兴趣相似者,形成基于知识共创与兴趣同构且不受地理因素限制的虚拟社群,促进了个体之间的联系、互动和知识共享。此外,匿名或半匿名的平台特性也在重塑实践社区的社会动力结构。根据社会身份模型的去个性化效应[12],匿名性能够削弱个体身份的感知显著性,强化群体身份的认同感,从而促进成员间的合作、互助与群体凝聚力。在线论坛与社交媒体因其匿名特征,往往成为表达观点与情感的安全空间,使个体更愿意分享真实经验与情绪反应。
本研究关注的豆瓣小组“今天和AI互动了吗”正是此类匿名在线实践社区的典型代表。该小组汇聚了对AI互动感兴趣的用户,他们通过发帖、评论与转发等形式,构建了一个共享AI经验与知识的共同体。该小组的简介部分写道:“不管是Siri还是ChatGPT,和AI互动一直是大家津津乐道的事情,除了日常闲聊之外,与AI的互动也能够激发大家的思考。”这一描述揭示出该小组既是AI用户的经验交流空间,也是社会文化想象的生成场域。换言之,豆瓣小组中的AI讨论既是一种实践,也是一种传播,它展示了用户如何在媒介互动中生成新的认知框架与情感认同。
基于上述理论与语境,本文提出以下研究问题:
RQ1:在豆瓣小组“今天和AI互动了吗”中,用户的讨论主题是什么?这些主题反映了用户的哪些AI使用动机?
RQ2:在豆瓣小组“今天和AI互动了吗”中,用户的讨论呈现出怎样的情感特征?这些情感表达揭示出用户对AI持有怎样的态度?
3. 研究方法
(一) 数据爬取
本研究使用Python爬取了豆瓣小组“今天和AI互动了吗”中1015条帖子的标题和内容,使用Jieba中文分词库进行分词处理。由于帖子标题通常较短,不适合进行主题分析,本文将帖子内容纳入后续主题分析和情感分析。
(二) LDA主题模型分析
狄利克雷分布(Latent Dirichlet Allocation, LDA)主题模型是最常见的文档主题生成模型之一,可以从大量的非结构化文本数据中发现潜在的主题[13]。通过计算文档与词语的联合概率分布,LDA可以揭示隐藏在文本语料背后的语义结构。与传统依赖人工编码的内容分析方法相比,LDA模型能够在更大规模的数据集中捕捉到隐含的语义关系,计算层面高效稳定,适合对社交媒体语料、在线社区发帖等非结构化文本进行探索性研究。
本研究采用Python中的Scikit-Learn包实现LDA主题建模。研究者首先对数据进行了系统的文本预处理,随后使用CountVectorizer、TfidfVectorizer构建词频矩阵与TF-IDF特征向量。在训练模型时,LDA主题模型要求分析人员预先设定主题数量。尽管可以通过困惑度和主题一致性等指标来评估模型的好坏从而确定最佳主题数,但是当主题数量过多时,模型可能已经过拟合。因此,本研究将主题数量分别设置为1~10构建主题模型,通过人工检查确定合适的主题数量。
(三) 情感分析
本文采用词典法与商用情感分析API的双模方法对豆瓣小组帖子文本进行情感极性与情绪类别分析,以期兼顾可解释性与稳健性。词典法优势在于可解释性强、易于追溯情感触发词,但对语境敏感性差,难以快速适应网络新词。商用API在上下文理解上占优,但往往为黑箱模型,可解释性受限。基于此,本研究综合使用两种分析方法。
1) 词典法
词典法是一种常见的情感极性分析方法,它基于情感词典来进行分析。这种方法的原理是通过匹配文本中的词语与情感词典中的词语,计算积极和消极词汇的数量和权重,从而确定文本的情感倾向。
本研究使用了大连理工大学信息检索研究室的中文情感词汇本体库(DUTIR)作为情感分析计算依据,该情感词典在中文语境中被广泛运用,覆盖面较广且能反映细化的情绪类型。DUTIR将情感分为7大类21小类,分别为:① 乐:快乐、安心;② 好:尊敬、赞扬、相信、喜爱、祝愿;③ 怒:愤怒;④ 哀:悲伤、失望、疚、思;⑤ 惧:慌、恐惧、羞;⑥ 恶:烦闷、憎恶、贬责、妒忌、怀疑;⑦ 惊:惊奇。积极词包含“乐”、“好”、“惊”三类,消极词包含“怒”、“哀”、“惧”、“恶”四类。
2) 百度API
除了词典法以外,本文还调用了百度API的SentimentClassify情感极性分析接口进行情感分析。百度API集成了基于深度学习的上下文理解能力,能够在一定程度上处理句法结构与上下文依赖,作为词典法的补充有助于提高结论的稳健性。该接口输出的情感极性分析结果中包含以下主要信息:分析的文本内容、情感极性类别(0 = 消极、1 = 中性、2 = 积极)、对情感极性分类的置信度、积极与消极情感的概率分布。根据返回结果中的情感极性类别和概率,可以判断文本的情感倾向,并根据置信度来评估分析结果的可靠性。
4. 结果分析
(一) LDA主题模型分析
研究者检查了每个主题数对应的模型分析结果,通过主题关键词归纳出各主题含义,同时结合可视化结果和困惑度(见图1)来确定最佳主题数。通常主题数量越多,模型的困惑度就越低。然而当主题数量过多时,模型往往过拟合,模型解释力下降。当LDA的主要目标是探索现有文本中的潜在主题时,LDA结果的解释和评价应取决于现实应用需求与实际情况[14]。经反复对比研究,主题数量为7时,主题间差异较为明显、语义集中度较高,且符合在线讨论语境下的认知逻辑。主题含义与占比、排名前20的关键词以及主题示例如表1所示。
Figure 1. Perplexity
图1. 主题困惑度
Table 1. Topics and keywords
表1. 主题及其关键词
No. |
Topic |
Keywords |
Examples |
1 |
AI技术与模型训练 (29.1%) |
人类 模型 问题 人工智能 能力 指令 数据 内容 故事 主题 结构 信息 答案 技术 训练 过程 领域 语言 社会 技巧 |
Llama 3大模型原理代码精讲与部署微调评估实战、Llama 3大模型使用的是标准的仅解Decoder-Onl式的Transformer架构;与之相对的ChatGPT使用的是
Generative Pre-Trained Transformer架构…… |
2 |
情感交流与社交互动 (15.5%) |
感觉 朋友 时候 有点 功能 陪伴 经历 聊天 试试 老师 大家 生活 人生 时间 故事 体验 话题 文学 情绪 事情 |
这里梦女,自调了独响角色,回应基本能做到不ooc了,但是感觉他完全记不住之前发生的事情(比如昨天晚上和他一起喝了酒,第二天问他昨晚一起干了什么,他说去看演出了,之类的……),是必须写到设定里才可以记住吗……这种没有共同记忆的感觉也太痛苦了…… |
3 |
多媒体内容处理 (8.5%) |
视频 大家 兴趣 模型 训练 内容 工具 功能 技术 文本 图像 数字 数据 领域 制作 课程 交流 世界 声音 广告 |
#我被这个AI工具惊呆了#这些图都是ChatGPT画哒。友友们猜一猜哪个图片是根据我下面这张图描述生成的 |
4 |
学术研究与专业交流 (10.9%) |
对话 内容 研究 形式 交流 时间 情感 结果 对象 报酬 论文 专业 会议 私信 质量 受访者 腾讯 录音 语音 软件 |
大家好,这里是一名新传在读研究生。对于某些UU来说,AI已经日渐成为树洞,朋友,恋人……本研究想进一步深入了解这些UU们使用AI的经历,如果你曾经与聊天机器人有过闲聊式经历…… |
5 |
人机对话与智能助手 (13.1%) |
机器人 聊天 问题 用户 代码 角色 对话 图片 智能 服务 方式 魔法 信息 事情 助手 感情 错误 体验 机器 内心 |
lz是荣耀安卓系统的手机,听说Voice Control of ChatGPT可以练口语,好不容易下载的安装包
解完压不知道怎么才能用呜呜呜 |
6 |
任务管理与问题解决 (10.2%) |
工作 生活 免费 个人 社会 文章 环境 资源 时代 方式 体验 问题 时间 课程 语言 英文 目标 工具 信息 价值 |
中文转拼音,日常工作经常涉及,在这之前需要写几行程序实现,现在只需要问下GPT就好了。其他编码转中文之前需要一堆网页工具,现在也是只需要简单问下GPT就行了 |
7 |
AI辅助创意设计 (12.7%) |
设计 问题 用户 大家 工具 网站 产品 语言 项目 内容 风格 功能 逻辑 中文 评论 绘画 专家 活动 游戏 文案 设计师 工作 故事 关键词 方法 |
相信大家都看过最近超火的PhotoShop接入AI后
的视频吧,那种随心所欲扩展画面、输入关键词
添加效果、一键替换主体背景都让人震撼,简直是
设计师的梦中神器 |
主题分布揭示了用户与AI互动的多维度特征。首先,主题1“AI技术与模型训练”在小组中的讨论占比最高(29.1%),表明用户对AI底层技术和模型训练过程表现出浓厚兴趣。关键词如“模型”、“数据”、“训练”、“算法”、“语言”等集中体现了技术导向型讨论特征。用户不仅是AI的使用者,更是技术学习者与知识分享者。他们在论坛中交流算法架构、参数优化、数据标注等问题,体现出知识共创的实践社群特征。其次,主题2“情感交流与社交互动”作为第二大主题(15.5%),表明用户对AI在情感支持和社交互动中的角色有所期待。该主题的讨论内容反映了AI在人际交往中提供陪伴、情感交流和支持的潜力。一些用户将AI拟人化,赋予其人格特征或情感记忆,并通过互动获得心理慰藉,展示了AI在人类情感交流中的应用前景。主题3“多媒体内容处理”尽管占比较低(8.5%),但该主题显示出AI在图像生成、视频编辑、语音合成等领域的多模态应用潜力,用户在AI技术工具中探索视觉表达与创意实现的可能性。该主题的出现说明AI技术正推动传播形态从文本媒介向多模态叙事转型,随着AI在多媒体内容生成和处理方面的快速发展,这一领域的讨论可能会逐渐增多。
主题4“学术研究与专业交流”也占据了一定比例(10.9%),这部分内容主要是人文社科研究者在小组中招募深度访谈参与者,或分享AI在学术研究中的应用经验。AI已成为人文社科研究的重要对象与工具,其不仅作为研究主题被探讨,也被用于数据处理、文本生成、语义分析等学术任务中。主题5“人机对话与智能助手”(13.1%)集中体现了用户与AI在功能性互动中的体验与反馈,体现出人机互动的日常化与功能化特征。主题6“任务管理与问题解决”(10.2%)同样揭示了AI在提高生活工作效率方面的重要作用。AI的效率和智能化使其成为解决实际问题的有力工具,能够极大程度满足用户的实用需求。最后,主题7“AI辅助创意设计”(12.7%)反映了AI在艺术创作和设计领域的潜力,AI能够激发用户的创作灵感、拓展表达形式、提升创作效率。
综合而言,LDA主题模型的结果揭示了豆瓣用户与AI互动的多维度特征:在技术层面,用户对AI模型原理与多模态内容处理展现出高度兴趣,反映出技术认知与学习的自发性;在社会与情感层面,AI逐渐被赋予社交与陪伴功能,成为用户表达情绪与构建关系的情感媒介;在实践与专业层面,AI被广泛嵌入知识生产、任务执行与创意设计中,展现出助力知识生产与创新实践的工具性与协作性。从传播学视角来看,这一多维结构体现了AI媒介化过程的三种趋势:其一是技术主体化,AI被视为具有自主能力的互动对象;其二是情感投射化,用户在AI身上寄托情绪与关系期待;其三是功能嵌入化,AI逐渐成为人类生活与传播实践中不可分割的组成部分。整体上,用户的讨论内容反映了AI从工具到伙伴的多重媒介身份,也揭示了人机共生时代的传播变革。
(二) 情感分析
使用DUTIR计算豆瓣小组“今天与AI互动了吗”帖子内容文本的不同情感类别分值。从情感类别分布来看,“好”类情感(如赞扬、相信、喜爱)占比最高,达到56.7%,反映出用户在与AI互动中更多地表达了认可与好奇等积极态度。其次是“恶”类情感(21.6%),主要涉及烦闷、怀疑、贬责等负面情绪,显示部分用户在使用AI过程中仍存在对其可靠性、伦理风险或使用体验的担忧。此外,“乐”类情感占比13.3%,表明AI互动为用户带来了愉悦、放松等情感体验,而“哀”、“惧”、“惊”、“怒”等情感占比较低,分别为4.9%、2.0%、1.4%和0.2%。总体而言,积极情感占比(71.3%)明显高于消极情感(28.7%)。
百度API的SentimentClassify接口分析进一步印证了这一结论。结果显示,豆瓣小组中约61.8%的帖子呈现积极情感,36.2%表现出消极情感,剩下2.1%的帖子被识别为中性情感。这一结果表明,尽管仍有部分用户在讨论中表达了对AI的担忧、质疑或负面体验,但整体上用户在AI话题中的情感表达倾向较为积极。这种情感格局可能反映出用户对AI技术的接受度不断提高,以及他们对AI应用潜力、智能化体验和未来发展的乐观期待。
需要注意的是,尽管词典法与API得出的情感倾向总体一致,但两者在准确性和解释力方面仍存在局限。首先,豆瓣平台的讨论语境中常包含大量网络流行语、隐喻表达与幽默语气,这些表达方式往往超出了传统情感词典的识别范围,从而可能导致情感极性识别的偏差。其次,帖子往往包含引用、转述等复杂语义结构,可能会存在缺乏上下文的问题,导致情感分析模型无法完全理解讨论的背景和语义,从而产生偏差。综合来看,本研究的情感分析结果在总体趋势上揭示了用户对AI互动的积极情感态度,但仍需结合语境和定性分析加以验证,以获得对AI用户态度更为全面与深入的理解。
5. 总结
本研究以豆瓣小组“今天和AI互动了吗”作为研究场域,运用LDA主题模型与情感分析方法,系统探讨了用户在在线实践社区中对人工智能的讨论主题与情感特征。研究旨在揭示用户与AI互动的动机、情感体验以及对AI的态度,进而理解在新兴媒介环境中,AI如何重塑用户的媒介使用实践与社会意义建构过程。
LDA主题模型的分析结果表明,豆瓣小组用户的讨论主题涵盖了技术逻辑与模型训练、情感交流、问题解决、创意设计等多维应用场景。用户对AI的关注不局限于其工具性功能,而是延伸至人与技术之间的社会性与情感性关系,通过AI满足功能性、娱乐性与社交性等多重需求。尤其是关于“情感交流与社交互动”的讨论比例较高,反映出AI正被用户赋予拟人化与情感陪伴的角色,成为用户日常交流与心理慰藉的新型对象,用户与AI之间的互动逐渐带有社会关系的特征。
情感分析结果则进一步揭示了用户在与AI互动时总体上呈现积极的情感取向。无论是基于DUTIR词典法还是百度API分析,积极情感的比例均显著高于消极情感。多数用户在讨论中表达了对AI技术的好奇、赞赏与期待,认为AI在创作、学习与效率提升方面具有积极作用。然而,也有部分用户表现出怀疑、焦虑与不信任情绪,尤其在涉及隐私安全、算法偏见或人机关系伦理等议题时,负面情感的比例有所上升。需要注意的是,现有的情感分析方法在处理在线社交媒体讨论时,可能面临一定的准确性问题,需要对分析结果持审慎态度。
总体而言,本研究通过对豆瓣小组讨论内容进行数据分析,为理解用户如何与AI互动提供了新的视角,并为今后关于AI技术社会化应用的研究提供了有益的启示。