摘要: 2025年初开源大语言模型(如DeepSeek)快速发展后,民航新疆空管局依托本地硬件,开展其在空管气象业务中的应用验证,半年内初步构建含气候数据统计、自动化代码生成等功能的业务应用系统。研究完成DeepSeek-7B/14B、阿里通义千问Qwen3-30B等模型的本地化部署,开发气象业务知识智能体、编程助手、无代码气候数据统计工具三类应用。最后从空管业务智能体、多技术协同、数据治理维度提出应用建议,为大语言模型在空管领域落地提供参考。
Abstract: After the rapid development of open-source large language models (such as DeepSeek) in early 2025, the Xinjiang Air Traffic Management Bureau of Civil Aviation, relying on local hardware, carried out application verification of them in air traffic control meteorological business. Within half a year, it initially built a business application system with functions such as climate data statistics and automated code generation. The research has completed the local deployment of models such as DeepSeek-7B/14B and Alibaba Tongyi Qianwen Qwen3-30B, and developed three types of applications: meteorological business knowledge agents, programming assistants, and no-code climate data statistics tools. Finally, application suggestions are put forward from the dimensions of air traffic control business agent, multi-technology collaboration, and data governance, providing references for the implementation of large language models in the field of air traffic control.
1. 引言
自2025年年初开始,开源大语言模型领域迎来了爆发式发展,以DeepSeek为典型代表的开源大语言模型,迅速吸引了各界目光[1]-[3],我们也顺势开启了大语言模型技术在空管气象业务中应用的验证工作。借助现有硬件资源,历经半年的试验,初步构建了基于大语言模型的业务应用系统,该系统涵盖了气候数据统计、自动化代码生成、知识检索以及气象数据分析等多个功能模块。下面结合大语言模型的技术验证工作,介绍大语言模型技术、部署方案、初步应用成果以及后续应用建议。
2. 大语言模型简介
大语言模型(Large Language Models,简称LLM)是人工智能的一个重要分支和核心技术领域。通常,大语言模型是一种由包含数百亿以上参数的深度神经网络构建的语言模型,通过对海量文本数据的学习和理解,具备了强大的语言生成、理解和推理能力,能够为人工智能在自然语言处理相关任务上提供有力支持。我们使用的DeepSeek、豆包、Kimi、ChatGPT等工具用于处理文档、编写代码、资料搜索、文献归纳等工作,极大地提高语言类应用的工作效率,这些应用都属于大语言模型的应用范畴[4] [5]。
目前主流的大语言模型工具,均需要联网运行,对话内容都会上传至第三方服务器进行识别处理,使用这些服务存在内部业务数据泄露风险。为了解决数据泄露风险,本文依托本地现有硬件资源,通过本地部署离线的大语言模型,完成内部技术资料、数据的分析处理,开展大语言模型在空管气象业务中的应用研究。
3. 大语言模型应用研究
3.1. 大语言模型本地化部署
为了验证大语言模型在空管气象领域的应用能力,结合目前开源模型性能和本地硬件资源配置,我们完成深度求索DeepSeek-7B和DeepSeek-14B、阿里通义千问Qwen3-30B等模型的本地化部署[6],通过多轮测试验证后,DeepSeek-7B、14B由于参数规模较小,在专业领域知识相对匮乏,直接用于民航气象本地化应用效果较差,而Qwen3-30B模型具备丰富的民航气象专业领域知识储备,无需本地知识库即可准确完成气象报文解码纠错、民航法规检索等工作,后续我们的本地化部署均采用阿里通义千问Qwen3-30B。
本地化部署硬件采用英伟达P5000显卡两块,内存128 GB,利用网络安全设备将Qwen3-30B服务接口发布至内网,经过压力测试程序,模型API服务可支持10人并发使用,具体效果见图1。内网用户可通过安装Chatbox、Cherry Studio等大语言模型应用软件即可使用相关服务。OA用户可利用大语言模型完成基本的文档润色、资料归纳、文字识别等基本的自然语言处理工作。
Figure 1. API stress test for local deployment
图1. 本地化部署API压力测试
3.2. 气象业务知识智能体
Figure 2. Schematic diagram of regulatory quick search
图2. 法规速查示意图
气象业务知识智能体是基于大语言模型技术构建的专业化知识服务系统,旨在整合气象领域各类知识资源,为气象业务人员提供精准、高效的知识支持与培训辅助。该智能体拥有知识检索、内容解析、问答互动等核心功能,能够实现气象业务知识的集中管理和智能化运用,从而有效提升气象业务资料的处理效率。
通过技术资料的收集整合,对气象法规文件、业务操作手册、技术规范文档、执照题库等多类型资料进行解析识别,形成本地知识数据库,业务人员通过对话式操作,可实现常用气象业务标准查询、业务技术资料归纳总结等功能;结合日常培训考核和资质能力排查工作,可实现基于题库的随机考核题目编制工作,相关功能示意见图2、图3。
Figure 3. Schematic diagram of question bank
图3. 题库示意图
3.3. 气象业务编程助手
为了满足气象业务数据应用和产品优化中的平台开发需求,通过部署内网气象编程助手,在确保气象数据和运行信息安全的基础上,为技术人员提供高效的开发支持工具。
编程助手涵盖Python、C#、JavaScript等常用编程语言的背景知识。基于该工具,气象中心成功完成了多项业务软件的开发与优化,包括风云卫星数据解码应用、气象历史数据归档平台、综合数据接收平台、闪电定位数据应用等。该工具为气象业务数据解码、海量数据管理、专有协议数据收集、网页数据抓取等功能开发,提供了完整且可靠的算法推荐和代码编写支持。
结合既有业务软件的开发经验,小型软件通常需约30天完成代码编写及测试工作。然而,借助编程助手,软件开发周期可大幅缩短。在完成需求分析和功能设计后,上述软件的核心业务代码平均仅需1天即可完成开发,从而实现新增业务需求的快速上线运行,如图4所示。
3.4. 无代码的气候数据统计工具
机场气象数据分析主要用于解决气候特征分析、复杂天气复盘、重要活动保障准备等工作,通常需要具备编程能力的技术人员来完成,开发人员利用SQL工具或Python脚本进行气候数据分析和统计,耗时较长,且开发的程序无法适配所有的气候统计需求。
结合大语言模型对自然语言的理解能力,借助MCP中的MongoDB数据库接口,我们构建了无代码气候数据统计工具,采用MongoDB实现乌鲁木齐机场45年的气象数据存储,大语言模型依托MCP服务实现MongoDB中气象数据表的查询、统计功能,气象人员无需掌握SQL查询语句编写规则,通过自然语言描述气候数据统计需求,例如“统计历史数据中最近二十年的最高温度”、“查询温度低于−30℃的时间有哪些”,大语言模型在理解统计需求后,将统计需求自动转换为检索查询命令,连接数据库执行查询操作,将查询结果进行筛选和分析,输出符合用户需求的气候统计结果。
这一方案彻底打破了传统数据处理对专业编程技能的依赖,将气象数据统计的门槛大幅降低。无论是气象业务人员、科研工作者还是非技术岗位的需求方,都能通过日常语言描述,轻松获取所需的气象数据信息,让数据价值更快、更广泛地服务于业务与研究。
Figure 4. Schematic diagram of code assistant
图4. 代码助手示意图
4. 大语言模型技术应用建议
4.1. 业务智能体:从信息整合到决策支撑
空管气象领域存在业务知识碎片化与决策时效性的矛盾,大语言模型通过本地知识库与业务场景绑定,实现突破。将核心法规、技术手册、历史案例导入知识库后,模型可完成知识结构化整合与语义关联。如航班备降应急时,能为人员提供法规依据、数据支撑与案例参考的一体化方案,打破知识壁垒,解决“不会查、查不全、用不上”问题,实现业务知识与AI双向赋能。
4.2. 业务应用:技术协同与场景适配
大语言模型在空管气象业务中存在场景局限性,需遵循“技术协同”与“场景适配”原则。构建“大语言模型 + 机器学习 + 深度学习”体系,如流量管理场景,深度学习模型预测流量,大语言模型转化结果并关联规则生成建议。同时,结合空管气象安全性与实时性要求,优化模型架构,确保技术精准落地,规避短板、发挥优势。
4.3. 数据治理:技术落地的基石
空管气象数据质量直接影响技术应用,数据治理需构建“全链条、标准化、安全可控”体系。依据数据分类分级要求,制定差异化策略;覆盖数据全生命周期,解决质量痛点;围绕技术应用需求,绑定业务场景。通过合规、全链条、场景化治理,保障数据安全、提供高质量支撑,助力空管智能化升级。