DCS死机现象有两种:人机界面死 机、控制器死机。前者比后者损失要小。控制器死机是I/O卡件安排太多或存储器容量不够,一旦控制器程序运行到某一位置,就停留在该位置,程序不再往下走,即使重启也无济于事。
人机界面(主要是操作站)死机现象所有DCS都不同程度地存在,只是频繁程度不同。另外与DCS使用时间长短有关。因硬件引起的死机,显示不再能恢复。如操作站电源电压偏低,很容易使操作站死机。由于软件和通信连线的速率选择不合适引起的死机现象经一段时间仍能恢复。操作站操作系统与监控软件磨合不好也能引起死机,对此维护人员毫无办法,称为原发性死机。由于某些配置不合理引发网络堵塞、内存太小等原因造成的死机,过几分钟后自己能恢复。
本文讨论的仅限于因系统、网络配置不合理等原因引起的死机现象,推荐一些处理办法。
一 DCS人机界面的死机现象
近来,由于MIS系统需从DCS中读取生产实时数据。在网络中接进动态数据服务器,有的采用DDE方式,在读取数据较多情况下(如3000点),由于DDE消耗资源较多,网络堵塞现象就变得十分频繁,并使得各种人机界面的节点死机现象变得严重。
网络堵塞现象的严重程度与多种因素相关。从操作站取数据,采用DDE方式,如果取的数据在500点以下,问题还不算太大。如果取几千点数据,操作站死机几乎是必然的。如果把节点连到DCS的通信网络上,从网络接口取数据,情况要好一些。
控制器把数据送到接口,人机界面从网络接口读取数据应遵守网络通信协议。网络物理结构有环型和总线型两种,总线网络在逻辑上也是环型的。星型网络只用于小系统(100个I/O点内)。常用通信协议是广播式,网络上的节点只要把数据送到网络上,它就要不断广播数据,需要数据的节点就接收数据。广播式协议的网络除这种方式外,还有一种方式:一个节点向网上其他节点问询数据,如其他节点没有,它就反复进行问询直至读取到这个数据。如果网络上根本没有这个数据,就会造成网络堵塞。
为使运行人员熟练DCS操作站的操作,可采用仿真系统,了解DCS的键盘,以减少误操作引起死机;也可了解操作站死机情况。
在DCS运行时间较长的情况下,组态只加不减,有一部分组态实际上已没有与真正的I/O点相连,与控制无关。在工程师站的用户应用程序中有这样的I/O点。动态数据服务器接入时,欲将DCS上所有数据点都读上去,因其中有大量数据点无效而造成网络堵塞,所以人机界面就发生死机。这时可用逆向工程师站读取控制器中的组态,与正向工程师站的内容进行比较,删除无效点,就可避免网络堵塞。
另一个应注意问题是在接入动态数据服务器时,应检查所有接口的软件版本是否一致,否则会影响数据传递。
解决网络堵塞的第三种方法是:如果采用例外报告方式,可加大例外报告区域以减少网络通信量。例外报告是指现场某点只在发生变化时把数据送到网络上。为防止点已坏而人机界面未知的情况,即使点不变化,超过一段时间也要报告。为减少网络上的通信量,把例外报告的两个参数都适当加大,也能达到减少数据量的目的。
最近推出的通用操作站多采用Windows NT/2000操作系统,监控软件也通用,如FIX、InTouch等。由于软件销售量大,存在问题较少,通用操作站开放性好,死机现象大大减少。如果驱动软件不太好,也会引起死机。重要的是,它无论维护成本、备件采购都不受DCS制造厂家的限制。但为防黑客、病毒侵入,防火墙不可缺少。
关键词:
人机
面的
死机
现象
研究
操作
网络
数据