企业: | 控制网 | 日期: | 2007-09-26 |
---|---|---|---|
领域: | 工控机 | 点击数: | 2221 |
1 引言 流程工业包括石化、冶金、电力、轻工、制药、造纸、环保等在国民经济中占主导地位的行业,是经济发展的重要支柱产业。流程工业生产过程物流和能量流连续,产品相对稳定,生产周期长,工艺流程基本不变,通过调整在线工艺参数可使生产具有一定程度的柔性。目前我国流程工业企业普遍存在着能耗大、产品质量差、生产工艺落后、自动化及操作水平低等问题,1999年我国流程工业能耗普遍比国外先进水平高出30%;而据测算,仅通过优化自动化系统及过程工艺参数的在线优化技术对过程生产增加收益的典型值为装置产值的3%-5%。针对现有生产工艺设备,从企业大量保存的历史数据中提取有用的知识,根据这些知识提高过程的控制及操作水平,在当今能源和自然资源紧张的情况下具有重要的经济和技术意义。 流程工业的生产过程优化问题按时期分两大类,一类是设计时的优化,工艺流程、设备类型和尺寸、生产操作条件都可以调整,但确定之后一般不做修正;另一类是运行中的优化,此时工艺及设备因素均已确定,只有操作条件可以变动。当环境条件变量变动时,运行变量值需要及时做相应的调整。一般而言,生产装置的操作条件在设计时已按设计指标优化并定义为标准操作参数,如按反应动力学分析得到的原料配比,过程单元设备的工作参数等。但在长期生产过程中,由于原料成份、公用工程等工况的改变和设备老化等常见因素,设计阶段定义的操作参数往往不能达到期望的效果。操作优化的目的是在现有工艺及设备条件下,通过调整可控变量,使生产过程处于最优工况附近,从而提高产值、降低能耗。虽然对于数学模型的优化问题已较容易解决,但由于现实生产过程的复杂性,精确建模的工作非常困难。 相对于建立能充分反映系统全局动态的精确模型而言,用户更关注于得到一些对指导生产有益的不精确甚至仅仅是定性正确的信息。另一方面,随着各种传感器、智能化仪表及数据库在工业过程中的广泛应用,流程工业企业在日常生产中积累了大量的过程历史数据,这些数据蕴涵了工业过程的客观规律和操作人员的丰富经验。但生产过程包括各种物理及化学过程,具有机理复杂、数据信息量大、处理难度大的特点。由于早期的工业计算设备缺乏足够的计算能力、有效的分析算法,这些包含过程运行状态信息数据的利用还只是停留在一个比较浅的层次上,大量的数据只是用来产生各种统计报表,或仅作动态查询以服务于在线优化或控制系统,而没有进行进一步的分析。 数据挖掘技术的出现使得从海量数据中提取操作优化信息变得可能,它不仅能对过去的数据进行查询和遍历,并且能够找出数据之间的潜在联系及规律,从中提取辅助用户决策的关键性信息。数据挖掘技术是近年国内外活跃的研究领域,商业化的数据挖掘软件已获得大量应用。但工业技术数据领域的数据挖掘相对尚未成熟。本文的目标,就是在介绍数据挖掘基本概念以及流程工业数据的特点上,结合流程工业的实际应用,解决工业中操作参数调优、故障诊断及预测等常见的问题,为流程企业日常生产经营提供决策决策依据。 2 流程工业数据特点 数据挖掘(Data Mining, 简称DM)又被称为数据库中的知识发现(Knowledge Discovery in Database, 简称KDD) 、知识抽取(Information Extraction)等, 是在大量数据集中提取隐含的、目前未知的、最终可理解的、有效的、新颖的、对于决策过程有用的知识的非平凡的过程[7]。数据挖掘技术是人工智能、统计技术、模式识别、数据库等领域交叉研究的产物。 数据挖掘可以分为探索型(描述型)数据挖掘和预言型(预测)数据挖掘两大类。所谓探索型数据挖掘是指在预先未知任何模式的情况下, 在数据集内查找模式的一种技术, 探索型数据挖掘主要包括统计分析、可视化、聚类分析、概念描述、关联分析、序列分析等。预言型数据挖掘则是已知一些模式的基础上在数据中查找特定变量与其他变量之间关系的一种技术, 预言型数据挖掘主要包括分类、回归预测、孤立点检测、规则归纳、时间序列预测等。数据挖掘自从上个世纪90年代提出后, 经过十几年的发展, 到现在已经发展为一种比较成熟的技术, 目前对数据挖掘的研究主要集中在数据挖掘模型[16]、数据挖掘技术和算法、数据挖掘应用等研究上。 尽管数据挖掘在许多领域得到很好的应用, 然而在流程工业中, 数据挖掘的应用却受到很大限制, 已有的一些应用其效果也没有像在商业、金融、保险、生物学等领域中所报道的那样好。究其原因, 一个很重要的因素是由于流程工业的数据特点所决定的, 以数据挖掘中的分类模式为例, 流程工业中的历史数据具有以下几个特点: (1) 生产装置产生的数据量巨大, 数据样本维数多。以炼油工业为例, 反映系统运行状况的数据由数据采集系统每隔几秒、十几秒就在实时数据库中产生一组数据, 每组数据中包含上万个记录, 如何从这些海量数据中得到有用的知识, 对于常用的数据挖掘算法是一个挑战; (2) 数据时间性强, 随着时间波动;流程工业的连续生产中, 由于工况的改变、操作控制的调整、原料改变, 数据时刻在变化, 这更增加了从中提取知识的难度; (3) 与商业上事务处理数据库中的数据不同, 流程工业数据的属性之间往往存在复杂的非线性关系以及相互耦合的现象; (4) 流程工业数据的质量指标和操作参数之间存在较大的时间滞后。在很多情况下, 由于装置是连续生产的, 因此很难得到操作参数与质量指标之间精确对应的数据记录; (5) 与商业上数据很少存在孤立点、噪声不同, 流程工业数据中往往存在较大噪声或者孤立点。由于原料改变、工艺改变、人为因素、生产装置故障以及测量仪表问题使得流程工业数据中不可避免地存在孤立点, 进一步增加了数据挖掘的难度; (6) 可用于分析的质量数据少。在流程工业的数据挖掘中, 通常需要对一些质量指标如产量、能耗、收率、纯度、杂质含量、环境影响等进行评价, 然而这些指标中, 有些往往是无法直接测量的,如产率、收率等, 有些虽然可以通过实验室分析化验得到, 如纯度、杂质含量等, 但这些指标采样周期长, 通常只有一天两到三次, 造成数据质量不高。 现有的数据挖掘软件大多以商业过程中事务处理为背景, 而这些事务本身相对比较简单, 目的也比较明确, 但在流程工业数据挖掘中则复杂得多, 例如当前操作参数下, 产品的某些质量指标比较差, 想通过数据挖掘来知道为什么。对于这样一个问题, 首先我们需要对工艺有一个比较全面的了解, 需要了解影响质量指标的主要操作参数有那些, 另外可能因为影响质量指标的操作参数太多, 我们只能选择其中的一部分, 还要考虑这些参数之间的耦合关系, 最后还要考虑时间滞后。由于工业过程所具有的特点, 很有可能我们需要的参数找不到, 在这种情况下可以采用一些其他的方法, 如建模来得到需要的参数, 但这样会使得最后挖掘出来的知识置信度较低, 这些因素决定了流程工业数据挖掘的难度。 3 流程工业中的数据挖掘建模 针对流程工业数据的特点以及日常操作应用情况,流程工业中的数据挖掘建模建立在对海量数据的处理基础上。与传统商业上的数据挖掘应用不同,流程工业中的数据挖掘涉及到生产过程的各个方面,贯穿于流程工业整个管理活动过程中,工业数据挖掘的应用主要包括预测建模、故障诊断、操作性能优化、新产品/工艺开发、库存预测等等应用方面。 3.1 操作性能优化 数据挖掘可以为企业生产挖潜增效。但是由于各种不可控的因素,生产状态不可避免地发生波动,操作参数也应随之调整。数据挖掘将根据对生产历史数据的分析和挖掘,诊断当前的生产状况,提出改变生产操作参数的具体建议,使生产维持在优化状态。在多变量的操作环境中,单一的质量要求对应着多种操作可能,人工无法完成这个对应质量控制要求的I/O模式匹配。在长期的操作过程中,有各种原因所致的设定值波动和调整,由于流程工业的大时滞多变量复杂性,操作参数优化未得到重视和利用。 对大量生产数据进行挖掘找到产品质量与工艺参数的模型关系,分析诸多变量作用下的产品质量规律,帮助质检人员、工艺人员弄清影响产品质量的主次因素,提出相应的对策,进一步调整工艺参数,进行质量控制,为实现生产过程操作优化提供指导。数据挖掘用于流程工业装置性能优化主要解决以下两个问题: (1)装置运行性能分析:对装置历史数据进行关联规则挖掘,找出装置操作参数和产品产量及质量之间的关联。如采用关联规则数据挖掘,寻找最佳的原油混炼比。 (2)采用决策树、关联规则数据挖掘找出班组操作差异性所在以及影响差异性的主要装置控制参数从历史记录中提取最优工艺设定及操作。 生产装置性能优化主要采用以下两种方法实现:第一种方法是在历史数据中寻找最优记录所对应的工艺设定值或动态操作过程,并基于样本相似性度量的搜索和时序匹配方法充分利用已有的历史经验,给出与当前工况最近似的最优估计;另外一种方法是根据历史数据提取既有状态的本质特征并利用各种方法探索历史中没有的最优方案,这方面内容比较接近的是序贯实验设计方法、定性推理方法、模式识别调优法。 3.2 预测建模以及故障诊断 在有条件建立比较准确的过程机理模型时,机理建模方法应是首选。但由于流程工业的复杂性和大规模性,建立精确的数学模型异常困难。当可以得到被控过程的输入输出数据时,可采用基于数据挖掘的方法,如神经网络、支持向量回归、PLS回归。当很难建立被控过程的定量数学模型时,住往采用基于知识的方法,如定性模型、模糊模型。采用基于数据挖掘的数据预测技术,可以建立起一些无法测量变量的预测模型,根据建立的模型可以进一步对影响目标变量的操作参数之间的关系进行分析,找出改善质量指标的操作变量调整策略。 利用数据挖掘还可以诊断和解决生产中的瓶颈问题、以及检测生产中的异常问题。例如,当生产中出现质量不合格、产量上不去、能耗或物耗居高不下等其他制约生产的难题时,采用数据挖掘中的关联规则、聚类等方法找出解决问题的办法。基于数据挖掘方法,对装置的历史数据包括正常状态、异常状态及各种故障状态数据进行聚类、分类及孤立点分析,可建立系统状态的评估和故障诊断模型。在此基础上可以根据典型故障或异常工况对装置运行进行实时监控.,当系统状态或动态趋势与故障样本匹配时可及时辨识出故障类型。对于数据噪声较小的数据集,可直接采用决策树及关联规则方法从数据集中分析故障与工况及操作因素之间的相关性,从而分析故障发生的原因。 3.3 其他应用 对于流程企业中的一个新装置、新工艺,数据挖掘通过对收集到的生产数据进行数据挖掘,可以帮助企业迅速找到生产的规律,确定最佳的生产操作参数,减少摸索的时间,尽快生产出合格产品,达到设计指标。开发新产品、设计新工艺时,采用数据挖掘可以帮助企业从有限的已知数据中发现规律,指出方向,少走弯路,缩短开发和设计时间。 采用数据挖掘可以从企业保存的大量历史数据中获取对生产经营有用的知识,全面、客观地分析企业的运作现状,探索企业运营的客观规律,使之为企业经营决策提供有价值的信息,达到减少库存、降低能耗、减少采购成本、提高管理效率的目的,进而使得企业获得利润。 4 流程工业数据挖掘应用实例 以某石化企业连续重整装置重整反应器为研究对象,采用数据挖掘中的决策树方法来建立过程操作优化的决策树模型。利用该模型,可以对装置的操作给出合理的建议,以帮助操作工提高操作水平,优化装置的生产。 该装置用于生产苯、甲苯、二甲苯等基本有机原料,同时副产氢气。重整过程主要反应有:环烷脱氢、异构化、加氢裂化和烷烃的脱氢环化反应。在重整过程中,反应器温度对加氢裂化和芳构化影响较大,提高反应温度有利于芳烃的生成,但当温度进一步提高时,加氢裂化反应增多,而芳构化反应减少,且催化剂结炭增加。因此,反应温度是重整过程中一个比较重要的参数,反应器反应温度的波动过大会直接影响芳烃收率以及装置运行平稳性。如何减少控制系统中控制参数对于反应器温度波动的影响,提高装置运行的平稳性,具有重要的意义。采用决策树归纳的数据挖掘方法,对于过程系统数据库中的历史数据进行分析,建立反应器温度波动的决策树预测模型,利用建立的模型对过程系统当前的操作进行预测,对于引起反应器温度波动较大的操作进行预警,根据生成的决策规则,对于这些操作提出建议性的调整措施,并反馈作用于控制系统,达到改善控制,提高装置运行的平稳性的目的。 以石化企业七月份连续重整过程的历史数据为对象,该数据来源于该装置的DCS。重整反应主要工艺过程简述如下: 来源于预加氢装置脱戊烷塔低料与加氢裂化装置的重石脑油进入进料缓冲罐,其液位与压力由控制器LC3003、PC3005控制。原料经过联合进料换热器预热后进入反应进料加热炉BA301加热,然后进入1号反应器DC301,从1号反应器出来后进入中间加热炉BA302A/B、2号反应器,然后依次进入加热炉BA303、3号反应器DC303、加热炉BA304、4号反应器DC304,最后进入产品分离罐。该装置主要测量点总共为95个,从中选取和反应器紧密相连19个主要测量点,其中包括重整进料缓冲罐液位与压力,重整进料量,进料加热炉、中间加热炉压力,反应器进出口温度等。主要测量点见表1。 表1 主要测量点工位号 得到的数据经过去除噪声,填补缺失值等预处理后,得到一段时间之内的控制参数变化引起反应温度波动率的分类数据模型,其中为时间间隔,在系统运行的过程中根据需要可以调节。为简单起见,将温度波动离散化为两类,得到类标号为High、Low的数据集,两类类标号分别代表反应温度波动较大和较小。进过计算,得到不同时间间隔下的决策树规则。 表2 决策规则 表3 决策规则 以上每条规则的规则体中的数字代表该参数增加或减少的百分数,正值代表增加,负值代表减少。每条规则后面的百分数代表该规则的置信度。如秒时,规则1表示的意义为,当DC301入口温度增加量超过10%,FA301压力减少量超过4.8%,DC302入口温度增加量超过0.4%,那么反应器温度波动将会比较高,该条规则的置信度为75.8%。 |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
1.我有以下需求: | |
|
|
2.详细的需求: | |
* | |
姓名: | * |
单位: | |
电话: | * |
邮件: | * |