1. 引言
当今,大数据技术已经成为推动中国国家发展战略的重要资源之一[1]。随着人工智能技术的快速发展,形如ChatGPT,以及百度AI对话这样的AI工具为数据分析、智能决策提供了前所未有的支持,有效提升了国家在数据治理和信息安全方面的竞争力。2015年8月,国务院印发的《促进大数据发展行动纲要》明确提出了加快建设数据强国的战略目标,推动大数据技术与产业融合创新。在这一背景下,高校积极响应国家号召,纷纷增设数据科学与大数据技术专业,例如北京大学、对外经济贸易大学、中南大学等院校迅速布局。2017年3月,第二批32所高校获批开设相关专业,2018年更有248所学校获得批准,显示出高等教育对于培养大数据人才的重视和响应速度。重庆邮电大学于2018年获批数据科学与大数据技术专业并开始招生,是国内第三批获批高校之一,专业近年来建立了扎实的教学体系[2]。由于数据科学与大数据技术专业是新开设的本科专业,不同高校根据自身教学资源与办学条件制订了相应的人才培养目标,虽然有各自特点,但从就业趋势上,在理论方面需培养具备信息科学、数理统计、数据科学和机器学习[3]等基础知识与基本技能;从实践上,应掌握大数据系统开发项目实践中涉及的采集、预处理、存储、处理、分析、可视化和数据安全等技术,以及对应的大数据系统开发平台组件,以此胜任数据科学分析、挖掘算法研究,解决实际数据挖掘工程问题复合型人才的国家战略需求。
“大数据系统开发实践”课程是一门数据科学与大数据技术专业学生的专业方向课程。本课程主要针对已具备大数据系统开发能力的学生讲授,以实践为主。课程涵盖了大数据系统综合开发应用的知识体系及热点领域,包括数十种开源大数据组件的部署、开发与使用,以及主流商业大数据平台的部署、开发与使用。针对专业学生特点和先修知识储备,力求使学生对该领域有比较全面清晰的掌握,并能够应用于项目实践和竞赛实践。为贴合实际大数据使用场景,本课程实验内容数据来源于互联网公司实际数据,其内容包含“淘宝双11大数据批处理分析系统”、“NBA统计大数据查询分析计算系统”、基于大数据流计算的“淘宝购物大数据实时展示系统”,以及关联大数据图计算系统的伴生网络分析。通过对本门课程的学习,使学生初步获得大数据平台部署、开发和管理的能力,并引导学生利用大数据技术解决遇到的海量数据获取、分析与处理、可视化等实际问题[4],以此响应国家对大数据专业就业生分析师与工程师双角色的人才需求。
Figure 1. Real-time stream computing architecture for Taobao shopping data
图1. 基于淘宝购物大数据实时展示的大数据流计算系统架构图
然而,由于大数据系统开发平台下的组件部署情况复杂、不同平台环境之间关联性强、组件版本依赖相互限制及网络环境不稳定等诸多因素,实验过程中出现的程序异常存在较多不确定性与复杂性。例如,在第三个实验基于流数据的计算流程中(如图1所示),涉及的大组件就包含了Kafka、Flask前端显示、socketio通信、Spark数据处理,以及未展示的Mysql数据库连接和Hadoop平台架构。其后还包含Scala语言、js语言、python语言在不同平台组件上的编程处理。而生成式AI作为一种有利的生产工具,在高校课程教育[5]、教学[6]、研究中取得了一定的实践可行性论证。
尽管近年来已有学者探索了人工智能在高等教育中的应用,例如课程思政评价工具[7]与学习分析平台[8],但在工程教育场景下,如何有效地将AI与课程实践深度结合,仍缺乏系统性的研究。此外,现有研究多数停留在工具层面,而未能结合学习理论对教学效果进行解释,这限制了相关工作的推广与普适性。因此,探索AI赋能背景下大数据专业《大数据系统开发实践》课程教学的新模式十分必要且具有重要意义,同时兼具挑战[9]。通过本项目的探索与研究,有望收获更好的教学效果,使学生学会正确利用AI赋能工具的同时,改善不知其所以然的实验模式,提升对大数据挖掘分析复合型人才素质、技术、能力培养的质量。
2. 高校学生指导现存问题
《大数据系统开发实践》课程作为数据科学与大数据技术专业的核心实践课程,对学生综合能力提出了较高要求。然而,目前高校在该课程教学中普遍面临实践难度大与学习支持有限等问题,学生多依靠课下自主搜索教程、模仿配置步骤来完成任务,知其然而不知其所以然,一直是大学生实践课的痛点和难点。具体而言,主要存在以下四方面问题:
(1) 教学内容设置忽视学生基础:如前文所述,大数据实践开发平台涉及的组件繁杂,编程语言类型众多,其语言风格存在千差万别,会受到组件部署情况复杂、不同平台环境之间关联性强、组件版本依赖相互限制、网络环境不稳定等诸多因素干扰。对于本科生而言,由于学生的理论和实践基础存在差异,无区分的教学模式使缺乏自主调试代码能力的学生产生挫败感,失去对当前代码任务以及后续实验的完成兴趣。
(2) 重“知其然”轻“知其所以然”的窘境:知其然而不知其所以然的窘境主要有两方面:第一方面,由于实验存在一定难度,课堂上教师难以做到多线程式地兼顾数名学生,且也难以覆盖所有报错问题,在较多时候,重启环境会解决大部分疑难杂症,但也使得存在的问题被掩盖。由于教师时间管理上的分身乏术,部分得不到帮助的同学会寻求同学调试代码通过测试。但在此类不知其所以然的方式下完成实验的窘境使学生难以触类旁通、举一反三地真正掌握不同事例下数据的应用、管理、操作,以及可视化等技术实现方式。第二方面,作为当下流行的大数据代表技术,生成式的语言模型如ChatGPT、百度AI对话等,已成为学生的第二老师。然而,本科生对于如何应用AI工具存在一定认知偏差,寄希望于工具给出完整解决方案而通常未果,模糊化了AI赋能工具的优势与劣势。与传统C++等编程语言不同,大数据系统开发下的语言编程类型众多,报错原因除语法问题外,还存在较多不确定性,因此,其劣势在于难以生成完整正确代码;而其优势在于会给出可能的问题所在点。在实际实践课教学过程中,会有部分同学具有良好的信息检索和代码解决能力,但学生“知其然”得到无报错的程序后,往往会放弃对之前报错原因的追寻,如何引导学生使用,亦是本项目所关心的重点之一。
(3) 考核方式难以反映学生对相关技术的掌握程度:《大数据系统开发实践》的考核方式为平时成绩、课堂验收、实践报告三部分。由于问题(2)窘境的存在,其验收过程与实践报告环节均存在难以查验掌握程度的问题。对于验收,学生存在在最后时段请同学帮忙完成,甚至于用他人电脑直接验收的情况。虽可通过询问细节来辨别学生真实的完成情况,但实践课教学的真正目的在于引导学生掌握技术与知识而并非与学生进行对立批评其不诚实行为。此外,关于课程报告,为快速完成报告,学生存在复制指导书、抄袭他人报告等行为,难以真正在做的过程中学得相关知识。因此,问题的根源在于引导学生主观能动地并知其所以然地完成实验。
综上所述,针对本科生的知识结构,如何将AI赋能工具正确使用,从不同方向引导并激发学生的主观能动性去利用AI工具深度掌握大数据系统开发下的相关技术,培养学生的实际动手、动脑,以及根据事例进行创新的能力是目前面向数据科学与大数据技术专业本科教学中急需解决的问题。本研究从构建主义和联通主义方向寻找突破点。建构主义[10]强调学习者在社会互动与情境中主动建构知识,而联通主义则突出知识网络和信息链接在数字化时代学习中的重要性。本研究所设计的AI赋能教学模式,正是通过智能工具和数据分析为学生提供实时反馈与多样化资源,从而营造支持自主学习与协作学习的环境,这与上述理论高度契合。
3. AI赋能实践课程促进高质量学习教学改革创新方案
大数据产业的发展依赖于高水平复合型人才的培养。《大数据系统开发实践》课程作为数据科学与大数据技术专业的核心课程,紧扣新工科教育理念,聚焦工程实践与系统集成能力提升,推动课程内容、教学方法与教学模式的协同创新。课程坚持“学生中心”,教学核心为“以实际数据驱动、实际任务为导向,知其然知其所以然为导出”,探索契合产业需求的新型教学模式。依托校企协同的产教融合机制,课程引入真实业务数据与技术场景,构建实践平台,实现知识向能力的转化。企业深度参与课程共建与案例指导,提升了教学的工程化与实用性,同时实现教育与产业的良性互动,推动协同育人机制持续发展,为新工科背景下课程建设提供可复制经验。
3.1. 阶段式学生基础对齐方法
大数据系统开发实践课程内容广泛、技术复杂,面对基础差异较大的学生群体,教学过程中亟需科学设计教学节奏与支持机制,以提升整体学习效果。第一阶段采用提前发布指导书的方式,借助专业班级的班导师机制,并结合可能的前期课程协作,帮助学生在课程开始前完成基础知识和工具环境的对齐准备,降低学习起点差异,为后续实验打下统一基础。第二阶段针对实际实验过程中学生在问题解决能力和编程细节处理上的差异,课程统一提供附带说明的完整示例代码,同时鼓励学生自主编写。通过设置类似游戏通关的不同难度策略,引导学生根据自身情况选择挑战路径,并结合分层考核机制与激励加分制度,增强学习的主动性和获得感。同时,课程采用线上 + 线下混合教学模式,利用超星、雨课堂等平台将知识点“化整为零”进行讲解,学生可根据自身时间灵活安排学习。线上资源配套考核机制建设,有助于提高教学效率与效果。整体来看,该双阶段教学策略有助于缩小学生间的基础差距,缓解实验中的负面情绪,提升对大数据系统开发能力的掌握与综合应用水平。
3.2. AI赋能下的主动性学习引导
随着人工智能技术的迅猛发展,以ChatGPT为代表的生成式语言模型正逐渐渗透到高等教育的各个环节中,成为高校教师与学生之间教学互动的重要补充工具。尤其在《大数据系统开发实践》这类实践性强、内容复杂的课程中,学生在课后难以及时获取教师指导、教师无法全面把握学生困惑的问题长期存在。传统教学模式中,教学资源和教师注意力往往集中于课堂,学生一旦走出教室,便容易陷入“无人可问”的学习孤岛。由此导致的“只知其然、不知其所以然”的学习状态,既阻碍了学生的深度理解,也影响了学习成效的可持续性。为此,借助AI赋能,重构学生的学习支持体系,以引导学生开展更具主动性的学习,成为教改的重要方向。一方面,AI工具具备全天候响应、跨学科辅助、语言理解和生成的能力,能够在学生遇到编程调试、报错分析、理论应用等问题时,给予即时反馈。这种“第二导师”式的陪伴,不仅缓解了教师无法时刻在线答疑的压力,更为学生创造了一个低焦虑、可自定节奏的自主学习环境。以本课程为例,学生在实际完成项目开发或代码实现过程中,常常会遇到环境配置错误、语法逻辑错误、库函数使用不当等问题。若完全依赖教师,难免出现延时解决甚至放弃处理的情况;但借助ChatGPT等AI工具,学生可通过提问获取即时解释、示例代码乃至调试建议,极大提升了问题解决的效率与学习的连续性。
然而,AI工具虽强,但“会问”是其发挥效能的前提。生成式AI基于自然语言交互的特性,要求用户提出的问题具备明确性、上下文信息清晰、逻辑条理和开放性特征。否则,AI容易输出泛泛而谈甚至偏离核心的答案。因此,引导学生掌握有效的提问技巧,是AI赋能下实现主动性学习的关键。本研究中,后续需要对自编指导书加入“AI辅助问询技巧”模块。该模块围绕几个核心能力展开训练,包括如何定位问题背景、如何用明确语言描述问题、如何在提问中嵌入技术上下文、如何引导AI多轮交互以获取精确反馈等。例如,在调试Spark Streaming任务时,若学生仅提问“为什么我运行不成功”,AI将难以有效响应;而若学生表述为“我在使用Spark Streaming读取Kafka数据时,运行时报错‘NoClassDefFoundError: kafka/common/Topic’可能是什么原因”,不仅语义清晰,而且包含具体技术关键词,AI能迅速聚焦问题、提供建议。这种案例将作为指导书的一部分,通过对比提问方式,引导学生理解“问对问题比答案更重要”的理念,提升与AI对话的有效性。
从前期阶段性实践效果来看,已在学校开设的微专业中进行初步试点,大一学生在自然语言处理模型训练、深度学习调参、代码复现等任务中,通过AI辅助问询实现了更高效的学习路径。学生反馈显示,AI问询的互动方式帮助他们在碎片时间内进行“随时随地的调试训练”,有效降低了技术恐惧感,提高了学习自主性。在此基础上,本课程将借鉴该经验,系统性地将AI赋能教学嵌入课程全过程,不再将AI仅作为“工具”使用,而是将其作为“主动学习引导者”融入教学策略设计。此外,本研究还关注AI引导对学生认知态度的影响。在“请求帮助式”调试中,学生往往只关注完成任务而忽略原理理解,而AI赋能所倡导的“探究式提问”在潜移默化中促使学生追问“为什么”,从而获得解决问题的成就感与认同感。这种正向体验,有助于学生从依赖性学习走向自主性学习,实现从“完成作业”向“解决问题”的认知转变。
综上所述,AI赋能不仅解决了教师无法实时答疑的教学困境,更通过“提问技巧训练–多案例应用–自我驱动反思”三位一体的设计,提升了学生主动学习的能力与意愿。未来,该模式可推广至更多具有复杂技术实践任务的课程中,推动高等教育中“教–学–评”模式的转型升级,真正实现“以学生为中心”的个性化智能教学改革。
3.3. 驱动式团队协同考核标准制定
为实现教学全过程考核以及提升学生学习后的技能掌握程度下限,并解决当前考核方式存在的不端问题,增强学生的实践能力和团队合作精神,采用新案例驱动式的团队协同考核标准,以下是具体方案:
1) 验收新案例或新分析维度,抛弃无效记录式实验报告
原有问题:实验指导书提供了若干来源真实且具有挑战性的业务案例,涉及大数据采集、存储、实时批处理、图分析等多个环节。以往报告为其实验过程的完整记录,但其中存在抄袭、篇幅过少等敷衍行为。
改进办法:鼓励学生团队利用AI赋能工具自主寻找或提出感兴趣的业务案例,经教师审批后实施,增加学生的主动性和创新能力。并在AI工具帮助下,仿照前序实验进行更新,自创实验并完成验收。
2) 团队组建
每个团队根据题目难度不同,可由3至5名学生组成,其成员需指明协同合作时负责的具体事宜,力求成员明确分工,包括但不限于数据框架搭建、数据分析、报告撰写等角色,避免“打酱油”。
3) 评估标准
在原有报告30%总成绩的基础上,对细节进行划分:
过程记录(30%):团队需详细记录每个阶段的工作过程,包括数据获取、处理和分析的每一步骤,提供完整的代码和操作说明,确保结果可重复。
团队协作(20%):根据团队成员的分工和合作情况和协作的效果,要求每位同学都进行工作互评。
最终报告(50%):团队需提交一份报告,包含问题定义、数据获取、处理和分析过程、结果验证和总结,报告需结构清晰、内容详实、逻辑严谨(占50%其中的30%),最后进行课程思政内容撰写(占50%其中的20%)。
通过以上方案,可以有效提高学生的实践能力和团队协作精神,减少抄袭现象,提升大数据系统开发课程的教学质量。
3.4. 挖掘课程中的思政元素
高校是立德树人的主阵地,课程教学是落实“课程思政”的关键环节。针对《大数据系统开发实验》课程,项目组在实践中挖掘其中蕴含的思政元素,将爱国情怀、社会责任与技术应用有机融合,构建具有时代特征和价值引领的教学体系。
在人工智能与大数据飞速发展的背景下,我国将数据视为国家战略资源,大数据安全与技术自主已成为国家命脉。当前诸如ChatGPT等工具在国内受限,反映出核心技术仍存在“卡脖子”问题,也凸显了自主可控体系建设的紧迫性。课程可引导学生关注百度等企业在生成式AI上的探索与突破,增强民族自豪感与责任意识。同时,技术发展带来社会结构变革,如“萝卜快跑”等自动驾驶的兴起既代表智能化趋势,也引发就业结构调整。课程还可结合双11淘宝交易、物流等真实数据,引导学生理解技术发展与民生福祉的关系,强化“人民至上”的理念。
此外,大数据与AI技术广泛应用于网络安全、公共治理等国家关键领域,课程中可通过讲授数据流管理、分布式架构等知识点,引导学生理解技术服务国家的深层价值。实践课程虽然强调以讲为辅,但课程同样需要设计引导性问题、嵌入时政案例,构建“以技术为体、以思政为魂”的课程体系,让学生在掌握专业技能的同时,自觉肩负起科技报国的时代使命[11]。
3.5. 风险及实施挑战
尽管本研究提出的AI赋能教学模式在课程实践中展现出积极潜力,但在实际推广和应用过程中仍面临若干局限性与挑战。首先,在学术诚信方面,学生可能存在对AI工具的过度依赖,从而削弱自主思考与动手实践的能力,甚至引发学术不端问题。对此,需要在课程实施中引入口头答辩、过程性评价以及技术性的作业查重手段,以有效降低风险。
其次,AI工具本身存在回答不准确或出现“幻觉”的问题。例如,在学生使用AI进行Python编程练习时,学生所使用的大模型工具可能会给出一段看似合理但实际上并不存在的库函数调用,例如,建议使用pandas.DataFrame.to_array()这一并不存在的方法,如果学生缺乏足够的代码调试经验则容易直接采纳,从而导致程序运行失败或逻辑错误。这类问题若未得到教师的及时纠正,可能会误导学生对知识点的理解和应用,导致学生在学习过程中受到严重误导。为此,教师需在课堂与课后及时进行二次把关,引导学生进行多渠道验证,从而培养其批判性思维能力。
此外,该模式对教师的工作量提出了更高要求。教师不仅需要掌握AI工具的使用,还需额外投入时间进行资源准备与过程监督,这可能加重教学负担。同时,如何保证AI在评价环节中的公平性与透明性,也是亟待解决的挑战。未来可以通过教师培训、优化AI工具的透明度设计,并将AI评价与人工评价结合,逐步探索出兼顾效率与公平的评价机制。
综上所述,设计该模式旨在提升学生的学习成效,一方面是因为其遵循建构主义的核心思想,强调学生在真实情境中通过任务驱动进行知识建构;另一方面,AI工具的介入使得学生能够在知识网络中快速建立多维连接,这与联通主义所倡导的学习方式相呼应。因此,本研究不仅是技术层面的探索,也是基于教育理论的教学设计实践。
4. 实践课程教学创新特色与成效
本研究目前主要基于现行课程进行设计并计划改进,便于后期开展实践观察提升实践课的教学改革。未来计划实施一个完整学期的教学实验,设立实验组(采用本论文提出的AI赋能的新型教学模式)与对照组(沿用传统教学模式),在保持课程内容一致的前提下,系统收集并对比两组学生在课程成绩、项目质量等方面的差异表现。同时,将通过问卷调查与半结构化访谈获取学生在学习满意度、自主学习能力、团队协作体验等多维度的数据,结合量化分析与质性研究方法,对改革模式的教学效果进行全方位评价。在数据分析环节,我们将采用统计检验、相关性与回归建模等方法,评估不同维度指标的显著性差异。此外,还将结合学生的主观反馈,探索AI赋能教学在提升学习动机、促进深度学习和增强实践能力方面的具体作用机制。通过后期一系列实证研究,期望能够将目前提出的“预期优势”逐步转化为“数据支持下的结论”,为教学改革提供更为坚实的证据支撑。同时,这也将为后续进一步推广与优化该模式提供依据,并为高等工程教育中AI赋能的教学实践探索积累可借鉴的经验。
此外,对于该实践课程的教学创新特色,可归纳为以下几方面。
4.1. 知识协同,打通教学链条
课程通过前期协同导论类课程与班导师机制,提前发布实验指导书,引导学生完成基础准备、前序课程铺垫等,统一工具环境与知识起点,正式教学阶段实施分层推进策略,配套考核激励机制及线上线下混合教学,逐步提升学生系统开发能力,打通教学链条,对齐学生基础。
4.2. AI赋能人机协同自主学习
通过引入AI辅助问答工具,配合实验指导书中“AI提问技巧”的训练,增强学生的问题意识与动手能力。AI赋能改变了“被动提问”的传统模式,激发学生主动探究精神,有助于培养其长期可迁移的问题解决能力和学习自主性。
4.3. 重构考核方式
打破以往单一评分方式,新增小组合作项目、过程性评价与展示汇报等考核环节,推动学生在协作中成长,提升沟通、分工、统筹能力。课程改革激发学生参与感与责任感,为后续科研、竞赛及就业中的团队协作能力奠定基础,为人工智能背景下的大数据实践类课程改革提供了可借鉴的经验与路径。
4.4. 融合课程思政培养家国情怀
在教学设计中融入中华优秀传统文化中的“修身齐家治国平天下”理念,通过案例讲解、项目研讨等方式,引导学生思考自身学习目标与国家发展需求之间的联系,润物无声地推进“爱国、爱民、重实践”的育人目标。
5. 结语
本文立足教育数字化国家战略,聚焦高校大数据系统开发实践教学中的现实困境,以注入AI赋能探析大数据系统开发课程的教学方法改革。具体而言,通过知识协同打通教学链条对齐学生基础;以AI赋能人机协同使学生学会使用AI工具问询,辅助其知识理解吸收;以重构考核方式落实学生能力掌握程度;此外,结合课程内容相关背景,挖掘融合课程思政元素,培养学生家国情怀。本研究寄希望于推动新工科背景下大数据开发实践类课程改革发展并提供可推广参考样本。
基金项目
本文得到重庆市高等教育教学改革项目“数字化赋能高校学生高质量升学途径研究”(244057)、“大模型产业化背景下‘三级联动·三维赋能’本硕贯通大模型算法人才培养模式研究与实践”(252080)、“‘学练赛思’四维模式下新工科大数据专业实践型人才培养体系建设”(233210)、重庆邮电大学教育教学改革研究项目(XJG24108、XJG25233、XJG24107、XJG22243、XWTJG2106、XJG25247、XJG23229、XJG23107、XJG23108、XJG21224)的资助。
NOTES
*通讯作者。