1. 引言
近年来,我国大力发展智慧城市,通过融合互联网、物联网、人工智能、大数据和云计算等先进信息技术,实现城市的感知、互联和智能应用。大数据作为智慧城市的血液,成为智慧城市建设各个领域研究和实践的重要资源[1]。
工业和信息化部关于印发《“十四五”大数据产业发展规划》,对大数据产业发展提出了新的要求,产业将步入集成创新、快速发展、深度应用、结构优化的新阶段。但是,大数据国家战略人才需求缺口仍较大,同时不同行业的大数据人才还存在分布严重不均的问题。
大数据人才培养是一个亟待解决的问题[2]-[6]。大数据专业以及以大数据为特色方向的相关专业,在培养方案中普遍开设了全面的理论和实践课程,例如云计算、机器学习、深度学习、数据挖掘、数据库、大数据可视化以及大数据应用实训等。目前大数据教学平台[7] [8]专业特点较强,多集中在自己专业特色上,一些商业化大数据教学平台具有一定的通用性,但提供给学生实践的接口一般比较单一,或者多数就是实验平台,无法满足学生实习、毕设等大型综合实践活动。
案例教学法通过引入生产实践的具体案例,启发引导学生参与实际工程问题的思考分析实践,是一种激发学习兴趣、培养学生综合实践能力的高效教学方法。目前各专业也大量使用案例教学法,建设自己的案例库。但是每个专业有各自的专业特色以及学校特色,内容和重点差异化很大,限制在本专业使用。也有一些商业化产品提供一些大数据案例,但是基础性较强,无法满足各专业的特色和个性化需求。
为解决上述问题,本文从智慧城市建设的高度重塑“建筑特色”,探讨以智慧城市大数据应用为结合点的特色专业发展方向。通过建设特色资源教学案例共享平台,落实好与建筑特色大数据结合、理工结合、与服务首都结合,让教学资源和教学过程建筑味十足,推进人才培养服务首都智慧城市建设。
2. 特色资源平台的建设
2.1. 建设思路
教学资源平台突出“重基础、强实践、凸特色”的人才培养方向,突破“建筑”的狭义范畴,从智慧城市建设的高度重塑“建筑特色”。平台规划主动与建筑领域中的城市规划、土木交通、城市测绘等相关专业和企业开展合作,共同探讨城市建设中韧性城市、智慧交通、智慧工地、智能测绘以及城市规划中大数据应用问题。以问题为导向,收集工程项目实际数据建立数据仓库;以数学为基础,计算机和信息为工具,设计和实现核心算法;以课内实验、综合实训、毕业设计、科培实培项目为抓手,落实实践能力和创新能力培养;以解决工程问题为目标,丰富建筑特色教学案例库。
资源融合平台有助于培养学生的跨学科思维。与建筑特色结合、与理工结合、与服务首都结合,可以为大数据应用专业的教学提供丰富的实践案例资源,使学生能够更好地理解和掌握相关的理论知识,提高教学效果。智慧城市大数据案例库系统可以为学生提供更接近实际的应用场景,使学生能够在实践中学习如何运用相关的理论知识解决实际问题,培养学生的实践能力和创新能力。将大数据案例库系统应用于教学,可以推动教学方法的创新,如采用案例教学,从而激发学生的学习兴趣,促使其从多个角度思考问题。通过大数据案例库系统的持续更新,可以确保教学内容的前沿性和时效性,为大数据应用专业的学生提供了更多、更全面的实践机会。此外,这种融合还有助于促进跨学科的合作和交流。
2.2. 平台架构
特色资源平台架构如图1所示,由五个层次组成:数据源、仓库、算法、案例和用户。
Figure 1. Diagram of platform
图1. 平台框架图
数据源。收集智慧城市建设领域中智慧交通、智慧工地、机械故障诊断、测绘大数据、城市规划大数据等,以及公共资源数据,如“北京市公共数据开放平台”的农业农村和房屋住宅等具有建筑特色的数据源。这些特色数据具有稀疏性、多源异构、空间关联性等特点,能满足各类数据处理算法的适用性。
数据仓库。对原始数据进行清洗、转换和归一化等操作,以提高数据的质量,便于后续的建模和分析工作。数据清洗:对数据集中的缺失值进行处理,选择删除含有缺失值的记录或使用统计方法估计缺失值。异常值检测:通过统计方法检测数据集中的异常值,并将其删除。重复值处理:检测和删除数据集中的重复记录,以避免模型过拟合和提高模型的准确性。数据整合:将数据从一种格式转换为另一种格式,将数值数据转换为文本数据。
算法库。建立机器学习、多元统计分析最优化问题等大数据算法库。算法库以多种形式存在,例如独立可允许算法库和部分公开算法库。独立可允许算法提供算法源码和使用帮助,例如分类、预测算法,数据排序算法等等。公开算法库,例如目标检测Yolo等较为复杂,提供算法的介绍,开源下载方式,使用案例说明等。
案例库。根据不同的课程基于特色数据进行案例设计和教学活动。包括了数据结构、数学建模、面向对象程序设计等多门课程的教学案例库;Python程序设计、数学建模、多元统计与数据分析等核心课程;各类综合应用案例等。
用户。平台面向学生和教师,支持课内实验、综合实训、毕业设计、科培实培项目以及研究生和教师教学科学研究等。
2.3. 案例建设
案例库建设可以从多个角度进行设计,例如根据课程、数据分类或算法等。以算法分类为例,大类分为机器学习和深度学习。案例库设计的核心是教学案例的设计,包括教学目标设定、使用的数据、涉及的主体算法、实现语言、实施过程以及实施结果。如图2所示为建筑业贡献率预测和北京郊区村落建筑物分割教学案例。
Figure 2. Template of case Library
图2. 案例库模板
案例精选具有建筑特色的大数据,在不同的教学过程使用相应难度和挑战性的算法,以北京郊区村落建筑物分割为例,数据特色鲜明,数据量庞大,涉及图片的裁剪、去噪、标注等基础工作。算法选用MaskRcnn系列,可以根据每年的算法最新发表成果实用性改变,一直保持算法的前沿性。案例实现的结果具有很强的实用性。该类案例特别适合进行毕设设计的选题或综合实训中数据处理或算法实践。
教学案例库在课设、实训和毕设中大量使用。以毕业设计为例,20%~30%毕业设计选题来自平台特色数据,近五年获得校级优秀论文5项,北京市优秀毕业设计(论文) 2项,软件著作权4项,如图3所示。
教学案例库突出了与智慧城市领域的实际问题相结合,设计的案例具有较强的深度和教学价值。使用过程中可以根据积累的教学案例进行教学,或根据实际任务,按模板进行个性化设计,并灵活添加进案例库。
Figure 3. Achievements of case Library
图3. 案例库教学成果
3. 平台的实现
我们采用Electron架构开发了一套基于C/S模式的软件系统,更好地满足各类角色使用。平台主界面如图4所示。平台分为特色数据、算法介绍、算法代码和案例分析四大模块。
Figure 4. UI of platform
图4. 平台主界面
特色数据包含案例分析所使用的数据,数据按主题分类:农业农村和房屋住宅,城市建设、城市规划数据等等,每个数据集都有相对应的栏目,包括数据简介,详细数据的展示。
算法介绍包含统计、数据分析、机器学习和深度学习等,利用演示文稿详细讲解每种算法的定义、原理和适用条件。
算法代码包含每种算法代码或模型框架,并且可以将算法代码的框架下载到本地计算机。
案例分析中包含算法应用于特色数据的案例分析结果,每个案例分析结果都有相对应的栏目,包括案例分析结果的展示。
4. 总结
交叉创新人才是大数据应用相关专业的培养目标,本文结合学校建筑特色,突出“重基础、强实践、凸特色”,突破“建筑”的狭义范畴,从智慧城市建设的高度重塑“建筑特色”。首先设计了特色资源教学案例共享平台,让特色教学资源贯穿人才培养的整个过程。以软件系统的形式实现了以教学案例为核心的特色教学案例实践平台,融合数据源、仓库、算法和教学案例的实践教学模式为大数据应用专业方向的学生提供更接近实际应用的场景,提升了学生的实践能力和创新能力。
基金项目
北京高等教育“本科教学改革创新项目”新工科背景下,数学类基础课程教学改革研究(项目编号:201910016004)。