1. 引言
新疆作为我国特色农产品重要产区,两色金鸡菊以其独特的药用和保健价值在当地农业经济中占据重要地位[1]。然而,当前农产品市场面临信息不对称、假冒伪劣产品泛滥等问题,严重制约了特色农产品的品牌发展与市场竞争力[2]。建立完善的农产品溯源系统,成为解决质量安全问题、提升消费者信任度的关键举措[3]。溯源系统通过对农产品生产、加工、流通等全环节信息的采集与管理,实现产品源头可追溯、流向可跟踪、质量可监控,为农产品质量安全提供有效保障[4]。数据库作为溯源系统的核心组成部分,其建设质量直接影响溯源系统的运行效率和应用效果[5]。因此,开展两色金鸡菊溯源系统前期数据库建设研究,对于推动新疆特色农产品产业高质量发展具有重要的现实意义。
本研究旨在确定两色金鸡菊溯源指标,设计科学合理的数据存储模型,形成一套完整的溯源数据库建设方案,为后续溯源系统的开发与应用奠定坚实基础[6]。具体目标包括:明确两色金鸡菊种植、生产过程中需采集的关键信息点,构建适应溯源需求的数据存储结构,确保信息的完整性、准确性和可追溯性[7] [8];通过数据库建设,实现对两色金鸡菊全产业链数据的有效管理与利用,为产品质量安全监管、企业生产决策和消费者查询提供可靠的数据支撑[3] [9];探索适合新疆特色农产品溯源的技术路径和方法,为同类农产品溯源系统建设提供参考和借鉴[10] [11]。
2. 两色金鸡菊溯源系统数据库建设的现状与问题分析
2.1. 国内外农产品溯源系统数据库建设现状
国外农产品溯源系统起步较早,技术相对更为成熟。例如,欧盟建立了完善的农产品追溯体系,通过统一的数据库标准和编码规则,实现了农产品从生产到销售的全程可追溯[12]。美国的农产品溯源系统注重数据的实时性和准确性,利用物联网技术(如传感器、RFID标签等)实现对农产品生产环境和流通环节的实时监控,并将数据实时存储到数据库中[13]。日本的农产品溯源系统则强调消费者参与,通过建立公开透明的数据库查询平台,消费者可以方便地获取农产品的详细信息,增强了消费者对产品的信任度[14] [15]。
我国农产品溯源系统建设已经取得显著进展。部分地区和企业积极开展数据库建设实践,例如浙江省搭建的农产品质量安全追溯平台,实现了全省农产品全环节信息的统一管理与整合;一些大型农业企业自主研发溯源系统数据库,有效提升了产品追溯效率[16]。当前,国内溯源系统数据库建设仍存在数据标准不统一、信息采集不够全面、数据库共享性不足等问题,这些挑战在一定程度上制约了溯源系统效能的充分发挥[16]。
2.2. 两色金鸡菊溯源系统数据库建设面临的问题
两色金鸡菊的种植分布较为零散,种植户规模较小且生产管理水平参差不齐,这使得信息采集工作面临诸多挑战。一方面,种植环境信息(如土壤肥力、气候条件等)需借助专业设备进行采集,然而部分种植户缺乏相关设备和技术,难以准确提供数据;另一方面,生产过程信息(如施肥、用药、采摘时间等)依赖人工记录,存在记录不及时、不准确的问题,影响了数据的完整性和可靠性[17]。
目前,国内尚未建立针对两色金鸡菊的统一溯源数据标准,不同企业和机构在信息采集、存储和管理方面存在差异。例如,在溯源指标的定义、数据格式、编码规则等方面缺乏统一规范,导致数据无法实现有效共享和交换,增加了数据库建设和维护的难度。
两色金鸡菊主产区的信息技术应用水平相对较低,物联网、大数据等先进技术在农产品溯源中的应用尚处于起步阶段。多数企业仍采用传统的人工记录和纸质档案管理方式,数据处理效率低下,无法满足溯源系统对数据实时性和准确性的要求。同时,缺乏专业的技术人才,制约了新技术在数据库建设中的应用和推广[18]。
随着信息技术的发展,数据库面临着越来越多的安全风险,如数据泄露、病毒攻击、黑客入侵等。两色金鸡菊溯源系统数据库涉及大量敏感信息,如种植户个人信息、企业生产数据等,一旦发生安全事故,将给相关主体带来严重损失。然而,目前多数企业对数据库安全重视不足,缺乏有效的安全防护措施和应急预案[19]。
3. 两色金鸡菊溯源指标的确定
3.1. 溯源指标体系构建原则
3.1.1. 科学性原则
溯源指标的确定需紧密围绕两色金鸡菊的生长特性、生产工艺以及质量安全要求,通过科学方法进行规划,从而精准且真实地反映产品实际状况。在选取指标时,应确保其具备清晰明确的物理意义,同时采用严谨统一的统计方法,以此规避因主观随意性导致的指标偏差,保证溯源数据的可靠性与有效性。
3.1.2. 系统性原则
溯源指标体系需构建覆盖两色金鸡菊全产业链的闭环架构,从种植环节的土壤环境监测、种子培育记录,到加工阶段的工艺参数控制、添加剂使用情况,再到流通环节的仓储温湿度变化、物流路径追踪,直至销售环节的终端流向与消费者反馈,均需纳入指标范畴。各环节指标应形成有机联动机制,通过数据间的逻辑关联与功能互补,实现产品从源头到终端的全流程信息穿透式追溯,确保溯源信息的完整性、连贯性与可验证性。
3.1.3. 实用性原则
选择指标时要考虑实际应用的简便性,确保信息处理流程高效。评估基层单位和企业的技术与管理能力,避免设定复杂或难以实施的指标。例如,小型种植户可用便携设备采集数据,而非昂贵仪器。指标体系应灵活,适应不同规模和管理模式,如规模化基地用自动化传感器,分散农户用简化人工记录,以实现广泛的适用性[20]。
3.1.4. 动态性原则
随着两色金鸡菊产业的发展和技术的进步,溯源指标体系应不断进行调整和完善。应根据实际情况及时更新指标内容,确保指标体系的科学性和有效性。
3.2. 溯源指标的分类与内容
根据两色金鸡菊全产业链的特点,将溯源指标分为种植环节指标、加工环节指标、流通环节指标和销售环节指标四大类。
3.2.1. 种植环节指标
基本信息:包括种植户姓名、联系方式、种植面积、种植地点等。
环境信息:土壤类型、土壤肥力(如氮、磷、钾含量)、土壤pH值、灌溉水源、气候条件(如温度、湿度、光照时长、降雨量等)。
生产管理信息:品种名称、播种时间、育苗方式、施肥情况(肥料种类、施肥量、施肥时间)、用药情况(农药名称、用量、使用时间、防治对象)、田间管理措施(如中耕除草、病虫害防治记录等)、采摘时间、采摘量等。
质量安全指标:农药残留检测结果、重金属含量检测结果、微生物指标检测结果等。
3.2.2. 加工环节指标
加工企业信息:企业名称、地址、联系方式、生产许可证号等。
加工工艺信息:加工流程、加工设备型号、加工时间、原料投入量、成品产出量等。
质量控制信息:加工过程中的质量检测记录(如感官指标、理化指标、卫生指标等)、添加剂使用情况(添加剂名称、用量、使用时间等)、包装标识信息(产品名称、规格、生产日期、保质期、产地等)。
3.2.3. 流通环节指标
物流企业信息:物流企业名称、地址、联系方式、运输车辆信息等。
运输信息:运输路线、运输时间、运输方式(如公路运输、铁路运输、航空运输等)、运输过程中的环境条件(如温度、湿度等)、装卸记录等。
仓储信息:仓储地点、仓储时间、仓储环境条件(如温度、湿度、通风情况等)、库存数量变化记录等。
3.2.4. 销售环节指标
销售渠道信息:销售商名称、地址、联系方式、销售方式(如实体店销售、电商平台销售等)。
销售记录信息:销售时间、销售数量、销售价格、消费者反馈信息等。
4. 两色金鸡菊溯源数据存储设计模型
4.1. 数据存储模型的选择
数据存储模型是指数据在数据库中的组织和存储方式,常见的有层次模型、网状模型、关系模型和面向对象模型等。关系模型具有结构简单、易于理解和操作、数据独立性高等优点,在数据库设计中得到了广泛应用。因此,本研究采用关系模型作为两色金鸡菊溯源数据的存储模型。
4.2. 数据库结构设计
4.2.1. 概念结构设计
概念结构设计是通过对现实世界的抽象和概括,建立概念模型,描述数据的逻辑结构。采用实体–联系(E-R)模型进行概念结构设计,确定实体、实体的属性以及实体之间的联系,如图1所示。
Figure 1. Entity-Relationship (E-R) model diagram
图1. 实体–联系(E-R)模型图
4.2.2. 逻辑结构设计
Figure 2. Relational model diagram
图2. 关系模型图
逻辑结构设计是将概念模型转换为关系模型,并对关系模式进行优化。根据E-R模型,将各实体及其联系转换为关系模式,如图2所示。
4.2.3. 物理结构设计
物理结构设计是根据数据库的逻辑结构,确定数据在存储设备上的存储方式和存取方法,以提高数据库的性能和存储效率。考虑到两色金鸡菊溯源数据的特点和应用需求,物理结构设计主要包括以下几个方面:
存储介质选择:采用磁盘作为主要存储介质,对于访问频率高、实时性要求强的数据(如实时采集的种植环境数据),可以考虑使用固态硬盘(SSD)存储,以提高数据读写速度。
数据分区:根据数据的时间、地域等特征,对数据库进行分区管理。例如,按种植年份对数据进行分区,将不同年份的数据存储在不同的磁盘分区上,便于数据的查询和管理。
索引设计:为经常查询的字段(如产品编号、种植户编号、生产日期等)建立索引,以加快查询速度。但索引的建立也会增加数据插入和更新的时间,因此需要根据实际情况合理选择索引字段和索引类型。
数据备份与恢复:建立完善的数据备份与恢复机制,定期对数据库进行备份,确保数据在发生故障时能够及时恢复。备份方式可以采用全量备份、增量备份和差异备份相结合的方式,以提高备份效率和恢复速度。
4.2.4. 核心数据表结构
两色金鸡菊溯源系统核心数据表包括种植户信息表(标识源头)、产品批次表(串联全链)、种植环境表(记录土壤气候)、加工记录表(工艺参数)、物流运输表(流通数据)。各表通过主键外键关联,嵌入生物特征字段,设复合索引与分区,保障全链数据闭环与查询性能。如表1所示。
Table 1. Core data structure table
表1. 核心数据结构表
表名 |
主键 |
关键字段示例(数据类型/约束) |
关联关系 |
种植户信息表 |
farmer_id
(VARCHAR (20)) |
farmer_name (VARCHAR (50) NOT NULL)、contact (VARCHAR (15) UNIQUE)、location (TEXT) |
与种植环境表通过farmer_id关联 |
种植环境表 |
env_id (BIGINT) |
soil_nitrogen (DECIMAL (5, 2))、soil_ph (DECIMAL (3, 1))、temp_avg (DECIMAL (4, 1)) |
外键farmer_id引用种植户信息表 |
生产记录表 |
record_id
(BIGINT) |
sow_date (DATE)、fertilizer_type (VARCHAR (30))、pesticide_dosage (DECIMAL (5, 2)) |
外键farmer_id和product_batch分别关联种植户与产品批次表 |
加工企业表 |
enterprise_id (VARCHAR (20)) |
license_num (VARCHAR (20) UNIQUE)、process_flow (TEXT)、quality_license (BOOLEAN) |
与加工记录表通过enterprise_id关联 |
产品批次表 |
batch_id
(VARCHAR (20)) |
batch_name (VARCHAR (50) NOT NULL)、plant_date (DATE)、harvest_date (DATE) |
主键同时作为流通、销售表的外键 |
物流运输表 |
transport_id (BIGINT) |
truck_num (VARCHAR (20))、route (TEXT)、temp_log (TEXT)、humidity_log (TEXT) |
外键batch_id引用产品批次表 |
销售记录表 |
sales_id (BIGINT) |
seller_id (VARCHAR (20))、sales_date (DATE)、price (DECIMAL (8, 2))、consumer_feedback (TEXT) |
外键batch_id和seller_id分别关联产品批次与销售商表 |
4.3. 数据处理算法
针对两色金鸡菊,构建“生物特征 + 时序”融合算法。用CNN提取花瓣光谱特征,结合LSTM处理环境时序数据,通过注意力机制强化关键特征关联;采用IQR与孤立森林算法清洗异常数据,利用图神经网络构建“种植户–环境–加工”关联图谱,提升数据处理精准度与全链溯源效率。
4.4. 数据安全防护措施
结合两色金鸡菊生物特征数据敏感特性,采用AES-256加密花瓣光谱等关键数据,通过零知识证明验证检测结果合规性,避免泄露具体数值;利用联盟链存证根系分泌物特征哈希,结合智能合约实现“生物特征–加工流通”数据关联审计,确保溯源数据不可篡改且隐私保护。
4.5. 数据性能测试和评估
针对两色金鸡菊生物特征数据量大、时序性强的特性,设计专项性能测试:模拟10万批次光谱数据写入,测试InfluxDB + MySQL混合存储的实时处理能力;用JMeter并发查询“批次–产地–生物特征”关联数据,评估复合索引与分区表的响应速度;通过压测验证区块链存证对生物特征数据的处理延迟,确保TPS ≥ 5000、响应时间 < 200 ms。
5. 两色金鸡菊溯源数据存储设计模型
5.1. 硬件设备选型与铺设方案
数据存储模型是指数据在数据库中的组织和存储方式,常见的有层次模型、网状模型、关系模型和面向对象模型等。关系模型具有结构简单、易于理解和操作、数据独立性高等优点,在数据库设计中得到了广泛应用。因此,本研究采用关系模型作为两色金鸡菊溯源数据的存储模型。
5.1.1. 信息采集硬件设备选型
根据两色金鸡菊种植环境和生产过程信息采集的需求,选择以下硬件设备:
环境传感器:包括土壤湿度传感器、土壤温度传感器、空气温度传感器、空气湿度传感器、光照强度传感器等,用于采集种植环境中的土壤和气候信息。
RFID标签与读写器:为每一批次的两色金鸡菊产品配备RFID标签,记录产品的基本信息和溯源数据。在种植、加工、流通等环节设置RFID读写器,实现对产品信息的实时采集和更新。
摄像头:在加工车间、仓储仓库等关键环节安装摄像头,实时监控生产和存储过程,为溯源系统提供图像数据支持。
5.1.2. 设备铺设方案
种植环节:在两色金鸡菊种植基地均匀布置环境传感器,传感器的安装位置应避免受到人为干扰和自然因素的影响,确保采集数据的准确性。对于规模较大的种植基地,可以采用无线传感器网络(WSN)技术,将传感器采集的数据通过无线传输方式发送到数据采集终端。
加工环节:在加工车间的关键工序位置安装RFID读写器和摄像头,实现对产品加工过程的实时监控和信息采集。RFID标签应在产品原料投入加工环节时粘贴,确保标签与产品一一对应。
流通环节:在物流车辆上安装GPS定位设备和温度、湿度传感器,实时记录运输过程中的位置和环境条件数据。在仓储仓库入口和出口设置RFID读写器,对进出库的产品进行信息采集和更新。
5.2. 数据采集与处理流程
5.2.1. 数据采集流程
种植环节数据采集:环境传感器按设定的时间间隔自动采集土壤和气候数据,并通过无线传输或有线传输方式将数据发送到数据采集终端。种植户通过手机APP或电脑终端人工录入生产管理信息(如施肥、用药、采摘等),数据采集终端对采集到的自动数据和人工数据进行整合和校验,确保数据的完整性和准确性。
利用两色金鸡菊花瓣中类黄酮、多酚等次生代谢物的光谱特性(450~700 nm可见光区吸收峰),通过微型光谱仪实时采集花瓣反射光谱,建立品种–产地–生长周期的特征数据库。如图3所示。
Figure 3. Petal spectrum acquisition process diagram
图3. 花瓣光谱采集过程图
加工环节数据采集:RFID读写器在产品加工过程中实时读取产品标签信息,获取加工工艺参数和质量检测数据。摄像头拍摄的视频数据通过视频采集卡转换为数字信号,存储到数据服务器中。加工企业管理人员通过管理系统录入加工企业信息和质量控制信息。
流通环节数据采集:GPS定位设备和环境传感器实时采集运输过程中的位置和环境数据,并通过车载终端将数据发送到物流企业的数据中心。仓储仓库的RFID读写器在产品进出库时自动采集产品信息,更新库存数据。物流企业管理人员通过物流管理系统录入物流企业信息和运输、仓储记录。
销售环节数据采集:销售商通过销售管理系统录入销售记录信息(如销售时间、销售数量、销售价格等),消费者反馈信息通过电商平台或实体店的反馈渠道收集,并录入到溯源系统数据库中。
5.2.2. 数据处理流程
数据清洗:对采集到的数据进行清洗处理,去除重复数据、错误数据和无效数据,确保数据的准确性和一致性。数据清洗可以采用规则过滤、异常值检测等方法。
数据转换:将不同格式、不同编码的数据转换为统一的数据格式和编码,以便于数据的存储和管理。例如,将不同单位的环境数据转换为统一的单位,将文本格式的日期数据转换为日期格式等。
数据集成:将来自不同环节、不同数据源的数据进行集成,建立数据之间的关联关系。通过数据集成,实现对两色金鸡菊全产业链数据的整合,为溯源查询和数据分析提供支持。
数据存储:将处理后的数据按照设计好的数据库结构存储到数据库中。对于实时采集的数据,可以采用实时数据库进行存储,以满足实时查询和监控的需求;对于历史数据,可以存储在关系型数据库中,便于数据的统计分析和挖掘。
通过分层设计清晰展示数据从采集到应用的全流程,特别针对两色金鸡菊的生物特征数据(光谱、根系分泌物等)和产业链环节特性,强化了格式标准化、特征关联及安全存证等关键节点,确保溯源数据的准确性与可追溯性。如图4所示。
Figure 4. Key technical points framework diagram for data processing
图4. 数据处理关键技术点框架图
5.3. 数据库管理系统选型与功能设计设计
5.3.1. 数据库管理系统选型
数据库管理系统(DBMS)的选型需综合考量数据处理能力、稳定性、安全性、可扩展性等的因素。结合两色金鸡菊溯源数据库的应用需求,选择MySQL作为管理系统。该开源关系型数据库具备性能稳定、易部署、扩展性强及成本低等优势,能有效满足中小型溯源系统的管理需求[20]。
5.3.2. 数据库功能设计
1) 数据存储功能
针对两色金鸡菊的生长周期、种植环境、加工流程等全链条数据,设计规范化的数据表结构。建立基础信息表,存储金鸡菊品种、产地等静态数据;设置动态数据表,记录生长过程中的温湿度、施肥记录、病虫害防治等数据;加工环节表则保存采摘时间、加工工艺、包装信息等内容。通过外键关联各表,确保数据完整性与一致性,支持复杂的关联查询,实现对金鸡菊全生命周期数据的高效存储与调用。
2) 数据操作功能
提供完善的数据增删改查接口。支持通过SQL语句进行数据的批量插入,满足大量数据快速录入需求;数据修改功能支持对单条或多条记录的精准更新;删除操作具备严格的权限控制与备份机制,防止误删重要数据。查询功能支持多条件组合查询,用户可通过产品批次、生产日期、产地等信息快速定位目标数据,同时提供模糊查询,提升数据检索的灵活性。
3) 数据安全功能
为保障两色金鸡菊溯源数据的安全性,采用多层安全防护策略。在用户权限管理方面,划分管理员、普通用户等不同角色,分别赋予数据查看、修改、删除等差异化权限;加密技术层面,对存储的敏感数据如农户隐私信息、生产配方等采用AES加密算法进行加密处理;定期进行数据备份,设置全量备份与增量备份策略,确保数据在遭遇意外情况时可快速恢复,避免数据丢失造成的损失。
4) 数据可视化功能
为便于用户直观了解数据,基于MySQL数据库搭建数据可视化模块。利用Echarts等可视化工具,将金鸡菊的产量趋势、销售分布、质量合格率等数据转化为折线图、柱状图、地图等可视化图表。用户通过简单的操作即可生成所需图表,实现对溯源数据的直观分析与展示,辅助管理者进行决策。
6. 小结
本研究围绕两色金鸡菊溯源系统前期数据库建设,系统分析了国内外现状与现存问题,构建了科学的溯源指标体系与关系型数据存储模型,并制定了完整建设方案。通过标准化数据管理与技术应用,有望解决农产品信息不对称问题,为全产业链质量安全监管与市场竞争力提升提供数据支撑,同时为同类农产品溯源系统建设提供可借鉴路径[21] [22]。
基金项目
2023年新疆维吾尔自治区重点研发计划项目(项目编号:2023B02010-2;课题编号:2023B02010-2;子课题编号:2023B02010-2-3)。
NOTES
*通讯作者。