1. 引言
技术数据分析报表是归纳、处理信息最常用的工具,是企业各种生产情况的汇总和反映,是管理的重要抓手和决策的基础。注水工作是采油厂油田开发的基础。为了强化注水管理,2010年以来,逐步构建起了一套源自基层的技术数据分析体系,为采油厂注水决策部署、技术改进、分析管理发挥了重要作用。主要体现在以下三个方面:
一是为成本预算安排提供数据支撑。如问题水井分析,为了准确预算问题水井治理费用,设计了问题水井月度报表。依据技术人员每月填报的报表数据,做出了采油厂新增问题井数月度曲线,对问题井数有了规律性的认识。依据规律性的数据,按照问题井治理工作量 = 目前问题井总数 + (月均新增问题井数 × 12),可以准确测算年度水井作业工作量。没有基层填报的技术分析报表,就得不出问题井数的规律;没有这些数据规律,无法决策一年的水井作业工作量。准确的安排部署,保证了问题水井得到及时治理,保证了分层有效注水,采油厂注水问题井总数由2010年的223口下降到55口,技术指标大幅改善。
二是为工艺技术改进提供信息支持。如作业井井下工具描述报表,注水井下工具的选型直接影响管柱寿命和能否满足分层注水。目前有什么问题、需要做哪些技术改进?这些都需要对井下提出来的工具进行跟踪描述,为此设计了作业井井下工具描述报表。对于优质防腐油管的选型,注水井井下原来曾有普通修复管、氮化、涂料内涂、镍磷镀、钨合金等多种油管,哪种油管能适应井下工况?能够达到长寿命?这些来源于基层人员3~4年400多口井的跟踪描述,油管使用多少年有了寿命期。通过持续跟踪,选择耐腐蚀、防垢效果好、使用年限长(4年以上)、可修复高的钨合金油管作为采油厂水井用管,其它油管在井3年后,失效率都比较高。这需要长时间的跟踪才能定型,基础数据来自基层填报的作业井描述报表[1]。
三是为精细技术管理提供准确依据。注水欠注层就是开发调整的潜力层,在对欠注层分因素分析治理方面,设计了欠注层月报和分因素统计月报,将每一个欠注层做到了准确地归到10种类型。针对欠注层成因定义了归类方法,统计的目的是为了治理。通过报表数据的统计、分析,让欠注层分因素治理的指标分解、考核得到落地。采油厂欠注层由最高的383个下降到195个,欠注水量由24,425 m3/d下降到9316 m3/d,注水结构得到根本改观[2]。
注水技术报表为采油厂注水工作提供及时、准确、详实的数据支撑。正是有了这些支撑,使得注水成本安排有依据,技术改进有方向,精细管理有支持。随着注水工作的进一步细化,技术报表的作用将会更加凸显。
2. 目前采油厂注水数据分析存在的问题
通过调研发现,目前需要基层完成的注水技术报表较多,并且需要层层上报、层层加工汇总,采油厂每月有大量的人力和时间花费在制作各类手工报表上。问题主要表现在以下三个方面。
2.1. 报表内容繁多,填报工作量大
为了及时掌握注水生产动态,不同管理层级、不同专业分别设计了一系列不同报表,报表数量多达92张。按照层级部门需求划分为注采站、管理区、采油厂、管理局、中石化5个部分,共计32类;按照专业系统需求划分为地质、工艺、注采、地面、测调5个部分,共计36类。如欠注层月报,为能够实现欠注层分类型、分单元统计、分析,每月有10张报表需要填写。填写内容多,分因素分析详细,五项因素共计40列数据。
2.2. 信息技术应用不够,重复内容多
在日常的统计分析中,为了保证每张表的数据结构完整性,类似内容的技术分析报表,大量基础资料重复出现,信息化应用技术不够。如套损井情况统计月报,局、厂、区三个层面的套损井报表,统计的信息大同小异,井号、序号、单元、单位、套损情况、套损时间、套损原因等17个数据重点信息相同。而水井作业效果统计月报要求,每口作业井要填写单元、井号、作业前后的注水泵压、油压、套压,每个层段的层位、水嘴、配注、实注等35个水井生产数据,这些数据中有33个可以从现有数据库中提取的。
2.3. 临时性报表多,随意性大
2015年中石化水驱开发工作大调查,安排6大类86张报表,每行填写内容多;其中大量数据可以从开发数据库提取,部门缺乏技术分析,为了图省事,当成“二传手”直接发到了基层。每年年底的技术大调研及座谈会,需要大量数据进行对比分析,各部门开展专题性的分析研究,下发大量调研报表,其中大量数据可以从开发数据库提取。
由于以上原因,造成基层技术人员有大量时间花费在做注水数据报表上。手工报表一是统计工作量大,流程复杂,报表制作周期长,效率低下;二是人工统计,无法保证数据的准确性、一致性,准确性差;三是油公司体制改革,人力资源减少,无法适应新形势。目前的报表运行方式已经不适应,有必要建立一套注水精细数据分析平台,减轻基层人员工作负担,提高劳动效率。
3. 油田注水数据精细分析平台研究分析
由于现有注水信息系统存在信息化水平低、数据集成性差、及时性滞后等不足,难以满足技术人员的新需求以及数据分析的需要。因此,油田亟需一套可以全面整合系统数据,满足注水系统技术人员对综合数据的分析,提高采油厂经济效益分析水平的处理平台。
3.1. 平台构建的基本原则
结合注水管理的实际需求,对注水类和水井作业类相关报表进行梳理、研究和规范,建立注水井信息从数据报表–原因查找–分类施措–效果跟通过踪等注水井精细管理描述的闭环式管理体系,规范注水井技术报表信息的录入、检查,研究指标算法,系统根据规范进行自动的综合统计查询,以达到注水单井数据的综合准确应用的目标。
3.1.1. 数字化原则
报表平台是数字化的,注水大数据分析平台是采集企业内外部的所有会计相关大数据,即从原始数据的采集,到最终注水大数据的分析,全部流程数字化,从而保证会计大数据的实时传递和分配。
3.1.2. 网络化原则
平台是网络化的,将地质、工艺等部门通过网络紧密联系起来,把分散在采油厂各个层级的数据联合,形成一个个环环相扣的信息流,满足全厂各个方面的决策需要,实现数据网络化。
3.1.3. 智能化原则
平台是智能化的,目前的数据处理技术有了翻天覆地的进步,计算机有足够的数据处理、存储能力和最先进的分析技术。使用大数据分析工具可以轻易地对采集的会计大数据进行深入处理分析,实现智能化,比以前更容易、更快捷、更清楚地分析事物,捕捉现在和预测未来。
3.2. 注水数据精细分析平台技术架构
3.2.1. 平台技术架构
系统的技术框架结构分为三层(见图1):
Figure 1. Functional framework of water injection data fine analysis system
图1. 注水数据精细分析系统功能框架构
(1) 数据层。是整个系统的基础,为上层应用提供数据支撑。整个数据层与源头数据库、开发库、作业运行库有数据接口,每日定时抓取业务数据,系统重分利用现有数据资源来生成自动化统计分析数据,减轻资料录入人员负担,同时为了建立适应发展、可持续改进的业务模型,从管理、业务、数据及应用四个层面进行数据库之间业务梳理与数据分析,理清企业组织机构、管理职责、业务活动、数据及应用资源的连通关系,形成数据库各个模型之间的全维画像,为高质量的数据应用提供模型支撑[3]。
(2) 数据处理层。为整个系统的核心业务处理层,主要开展数据清洗和数据模型挖掘工作。数据清洗方面主要结合数据需求及数据资源盘点情况,分析系统之间数据流转和引用关系,评估各系统库数据质量,明确各数据项唯一来源,将源端数据经过清洗后,构建数据之间的维度关系,采用数据仓库维度建模技术,设计一套跨专业、跨部门、统一共享的维度模型,并结合注水业务需求特点,对数据进行提前汇总处理,保障多维度数据统计结果一致性,提升注水业务数据查询效率。数据模型挖掘方面在注水业务信息化过程中建立了各种来源的数据库,由于没有统一管理,导致开展数据资源应用工作量大,人工整理费时费力,已建应用的数据模型与数据标准匹配情况不清,哪些业务已有应用支撑,哪些业务未覆盖,数据模型建立、更新是否遵循数据标准、应用间有哪些数据表、数据项存在重复等问题不得而知。通过数据模型的挖掘管理,一方面通过各类型的数据模型批量自动化提取及模型集中管理解决企业数据资人工整理工作量大的问题;另一方面通过数据模型与数据标准关联,使信息化应用过程标准化、规范化,实施数据挖掘及算法管理。通过基于大数据技术的数据挖掘,明确数据指标模型分类分级、责任归口、算法规则,实现指标注册、数仓构建、溯源分析、共享使用、多维分析,提升指标加工处理效率与使用率,同时深入挖掘注水业务数据之间潜在的业务逻辑关系[4]。
(3) 展示层。根据不同用户群需要,面向对象定制相应的软件功能。根据用户的分类,总体包括层段合格率、超注分析、欠注分析、问题井分析等多个功能分析模块。
3.2.2. 平台技术路线
(1) 系统选型。本系统主要功能将采用B/S结构,这主要是考虑硬件环境易满足要求;维护和升级相对简便;用户使用方便,无需安装客户端程序,直接打开网页即能操作。
(2) 数据库选择。该系统需要管理的基础数据量与结果数据量较大,并且要在数据库上运行存储过程、触发器等程序,同时对数据的安全性要求较高,所以本系统也采用ORACLE数据库。
(3) 系统模式。为保证系统具有一定的可扩展性和可维护性,系统架构需要符合“高内聚,低耦合”的思想,所以其在架构上应采用表现层(UI)、业务逻辑层(BLL)、数据访问层(DAL)分离的方式。
4. 胜利采油厂注水数据精细分析平台建设技术措施
以单井信息为基础,构建技术分析数据库,按照信息数据源头提取,不完整信息人工补录,补充完善扩展功能,梳理定义逻辑关系,最终平台实现技术报表自动生成,分析结果智能推送。主要采取以下三个方面措施。
4.1. 系统构建报表数据库结构
4.1.1. 系统梳理注水报表数据项
以单井为载体,将现有的36类92张报表内的数据项进行梳理,以信息量较大的注水层段合格率统计表为基础表,逐一罗列所有数据项,整合去除重复项,形成一张涵盖所有报表项的“大报表”,共计362项。将报表数据项按照信息内容进行归类,整合分为基础信息、套管状况、作业信息、生产信息、管理信息、地面信息等六大项。
4.1.2. 建立报表数据库基本字段
数据库的基本单元是字段。为此,对362项报表数据项进行分析,将不是基本字段的数据项逐一转化,建立形成了含有272个字段的基础数据库。如生产信息中,层位、配注等数据项也是数据库中的基本字段;而实注能力、差值等则不是基本字段,可以用月注水量与注水天数这两项基本字段计算生成。
4.1.3. 扩展、优化数据库字段
系统调研、分析用户需求,扩展能够满足未来需求的信息,数据库基本字段由272个增加到354个。例如套管状况数据表,有38个字段,能满足现有4张套损报表的需求;考虑未来调查贴堵井的类型、段数、内径、生产情况等需求,按照可提取的原则,增加了表层套管、技术套管、贴堵段顶界、底界深度,是否可钻、最小内径等,字段数量扩展了15个。
4.1.4. 确定数据库字段来源
利用开发数据库、作业管理系统、开发预警平台、采油工程决策系统等平台,可实现源头数据库字段自动提取315个,人工录入39个,录入工作量仅占10%左右。
4.2. 建立数据平台标准化信息
按照“源点唯一、标准唯一、一次采集、各级共享”的原则进行搭建。用数据库的方式管理和保存数据,是信息化的基础。目前数据信息化主要存在以下三类问题:
一是信息格式不匹配。文本类信息不符合数据库格式,计算机无法识别;
二是归类方法不一致。细分因素不全、有交集,计算机无法归类;
三是计算方法不清晰。指标计算类的定义、计算公式不清晰,计算机无法计算。
为此,开展了三个方面的标准化。
4.2.1. 文本信息标准化
把无法实现统计对比的文字描述信息,转化为可规范采集的数据字段,为分类统计、分析提供数据支持。如套损井月报中,文本信息,通过数据表格化的方式,能够很好的被储存下来(见图2)。
Figure 2. Schematic diagram of text information standardization
图2. 文本信息标准化示意图
4.2.2. 因素分解标准化
对于需要细分因素的数据项,按照因素全、无交集的原则,对每项因素进行定义,给予明确标准。以套损井分类的标准化为例,以往套损情况按照套窜、弯曲、破漏这三项进行统计,分类内容不全,没有分类标准。数据统计填写时每个人的理解不同,从而出报表来以后无法应用,信息数据无法得出正确认识,影响决策。通过标准定义,将套损情况按照形态细分为6类,每项都有分类标准,涵盖目前所有套损情况,保证了细分数据的准确性,为分类治理提供依据[5]。
如欠注层分类的标准化,按照“分类因素能够与治理措施相对应”的原则,将欠注层细分为10类,每一项都有明确的定义;当一个欠注层存在2个及以上因素时,取主要矛盾归类,实现了无交叉,为考核、治理提供了准确依据(见图3)。
Figure 3. Standard statistical table of factors classification of underinjection layer
图3. 欠注层分因素分类标准统计表
通过对欠注层、停注井、套损井等13项数据的系统梳理,重新定义108个小项细分因素,并对分因素概念进行标准定义,确保正确分类,为报表自动生成提供条件。
4.2.3. 指标定义标准化
对于每一项需要计算的指标,给予明确的统计方式和计算方法,确保计算准确。如注水合格率报表,该套数据在水井作业有效率、超注月报等5张(见图4~8)报表中重复引用,是较为重要的数据表。但其数据引用判定较为复杂,单井单层评价方法不标准,指标统计汇总易出错,仅能是实现日度评价。通过本次系统梳理,标准定义了选井条件和计算方法,并将生成结果保存在平台数据数据库,方面以后调用。模块化建立计算统计语言,形成文本文件保存,为将来的源头数据接轨提供技术支撑。是有了这些精准、可量化的定义和计算公式,使得信息化成为现实[6]。
Figure 4. Well selection conditions for qualified rate of water injection interval
图4. 注水层段合格率选井条件
Figure 5. Single-layer evaluation standard of qualified rate of waterflood interval
图5. 注水层段合格率单层评价标准
Figure 6. Single well data of qualified rate of water injection interval
图6. 注水层段合格率单井数据
Figure 7. Summary of qualified rate index of waterflood interval
图7. 注水层段合格率指标汇总
Figure 8. Results of qualified rate index of waterflood interval
图8. 注水层段合格率指标结果展示
如注水层段合格率月报,以单井为基础,按照选井条件筛选井号确定检查层,按照单层评价标准分类定义,按照注水方式进行分别统计汇总,规范计算统计方法逻辑输出,并对变化趋势、层级指标排名情况进行评价,为技术人员决策提供支撑。
4.3. 梳理逻辑输出柔性报表(见图9)
基于单井的标准化报表数据库,建立逻辑关系,自动生成各类注水报表。
4.3.1. 建立校验机制,保证数据质量
建立逐级审核机制,对于不符合标准规范、波动异常的数据,通过计算机校验、判断,将校核内容推送到计算机桌面,经相关人员修正、注明后才可存入报表库。
4.3.2. 梳理逻辑输出柔性报表
按照构建的数据库组件,根据所需内容,自定义组合数据表所需内容,通多注水精细分析平台进行提取调用,实现技术月报等信息的阶段查询对比、动态变化预警、大数据趋势分析等内容,解放人工统计计算工作量,为技术分析提供支撑。
Figure 9. Flow chart of data audit verification mechanism
图9. 数据审核校验机制流程图
5. 平台应用效果评估
5.1. 数据准确率
通过对比平台生成的数据与实际数据,评估数据准确率。经过一段时间的运行,数据准确率达到了99.3%,确保了数据的可靠性。
5.2. 工作效率提升比例
实施平台后,报表填写时间减少了70%左右,日常工作报表计算工作时间由55%降低到20%,工作效率大幅提高。
5.3. 用户满意度调查结果
通过问卷调查的方式,收集用户对平台的满意度反馈。结果显示,用户对平台的满意度达到了98%,认为平台操作便捷、功能实用,实现了数据的集成和共享,提高了数据分析的效率和准确性,为决策提供了有力支持。不足在于部分功能还需要进一步优化,如数据可视化效果有待提高。
通过以上各项措施的实施,基层技术人员由原来的手工一项一项统计做多张报表,转变为录入部分基础数据,各种固定报表、个性需求的定制报表即可自动生成。通过近2年的技术研究及应用,实施后报表填写时间减少70%左右,日常工作报表计算工作时间由55%降低到20%,工作效率大幅提高。注水数据精细分析平台将“大数据、云计算、群共享”贯穿于日常技术分析,使各级技术人员能够腾出精力,付出努力,展示能力,实现老油田高质量发展。