浙江电网变电站研华工控机运行的情况的分析和对应处理措施

作者:工业平板电脑|手持终端解决方案提供商    来源:www.wxtkj.cn    发布时间:2015-06-16 08:44    浏览量:

        浙江电网变电站研华工控机运行的情况的分析和对应处理措施:从电厂监控系统在变电站开始应用起,IPC工控机就借助PC平台规模化的硬件资源、丰富的商业软件资源和普及化的软硬件人才资源,在变电站计算机监控系统中有着广泛应用,但是随着应用的深入延伸,IPC工控机存在的缺陷逐渐暴露出来了,如机箱散热、板卡接触不良、硬盘数据丢失等问题在运行中常有发生,在变电站计算机监控系统的缺陷统计中占有很大比例。

    2002年以后随着间隔层设备直接上网技术、嵌入式系统技术以及新一代CompactPCI工控机标准的日趋成熟,厂家也陆续推出了相应的新产品,以解决IPC工控机在变电站计算机监控系统应用中存在的问题。浙江电网110kV及以上电压等级预计变电站(含发电厂升压站/开关站)计算机监控系统的IPC工控机保有量相当大,2002年后仍有不少新投运(改造)的变电站监控系统大量采用了IPC工控机。预计在未来一段时期内IPC工控机总量还会有所增加,但增加幅度会逐渐回落。

1 工控机故障原因分析

    1.1 风扇寿命影响机箱散热

    受组屏安装尺寸限制,IPC工控机通常采用卧式或一体化结构机箱,机箱内部空间相对狭小而板卡数量较多,发热量较大而散热通道却不畅通,被动散热性能很差。为保证散热效果,避免高温对机箱内电子元器件产生不良影响,IPC工控机无一例外地采用了风扇主动散热方式。风扇主要安装在机箱电源、CPU、主板芯片等发热量较大的部件附近,风扇电机驱动扇叶机械转动以空气对流效应来达到散热目的。但长时间机械转动必然会对风扇电机轴承造成磨损,风扇运行寿命有限。当风扇因故障停转后机箱内产生的热量无法及时排出,温度会急剧升高,对板卡上的电子元器件造成严重损害,导致IPC工控机出现异常、死机甚至永久性损坏。

    因此加强对风扇运行工况的实时监视,并定期对风扇进行维护和更换是非常必要的,但在技术上实现起来有一定困难。首先正常运行过程中机箱始终处于密闭状态,除开关电源的风扇外其他风扇均位于机箱内部,无法以目测方式进行实时监视;其次IPC工控机都被要求全年24h不间断运行, 很难有机会对风扇进行定期维护和更换。此外IPC工控机多采用组屏方式,平时屏柜前后门均处于关闭状态,屏柜内空气不流通、温度偏高,对散热不利。苛刻的运行要求、恶劣的散热环境以及缺乏定期维护等因素使散热风扇成为IPC工控机故障率高的部件。

    此外,IPC工控机的硬件结构决定需要风扇和散热通道, 运行过程中灰尘等杂质很容易通过风道进入机箱内部并附着在风扇和板件上, 直接影响了风扇的转动、板件的接触性能及内部散热, 对工控机的性能及寿命造成不良影响。

    1.2 板卡接触不良

    为提高抗干扰性能,IPC工控机采用了无源总线板方式, 每块板卡(包括CPU板)均以插槽金手指边缘接触方式与无源总线板相连, 并通过无源总线板以总线方式与其他板卡进行通讯和数据交换。这种金手指连接方式虽然方便, 但却存在很大隐患。首先运行状态下IPC工控机自身会产生振动, 振动源主要来自于散热风扇和硬盘电机的高速旋转(风扇转速通常2000~4500r/min,硬盘转速5400~7200r/min)以及开关电源工作时产生的振动。板卡金手指与无源总线板插槽之间的金属性连接很容易因为机器自身振动或外力冲击而瞬间接触不良。

    其次,板卡和插槽金手指普遍采用表面镀铜工艺以减小接触阻抗, 但在长期使用过程中金手指表面镀铜层容易被氧化或腐蚀造成接触不良。

    此外IPC工控机所有板卡均通过金属挡板用螺丝固定在机箱上, 在机箱振动作用下板卡与金属挡板相连部分会产生微距离逆时针旋转位移, 而板卡金手指部分被卡在底板插槽中无法移动, 长期运行容易造成板卡印刷电路板的变形、断线和接触不良。上述情况都是引起系统故障甚至死机的重要原因。

    1.3 硬盘数据丢失

    硬盘是IPC工控机中重要的部件,因硬盘损坏和硬盘数据丢失造成的后果往往非常严重, 有时甚至是致命的。与风扇类似, 硬盘也是通过电机驱动盘片高速机械旋转来进行数据的快速读取和存储, 因此硬盘电机的寿命也有限。尽管硬盘厂家采用了诸多先进技术(如用液态轴承电机技术代替滚珠轴承电机),但也只能在一定程度上延缓却无法彻底解决电机轴承的的磨损问题。IPC工控机全年24h不间断运行的特点使得硬盘电机始终处于高速旋转状态, 电机磨损比较严重, 损坏几率大大升高。

    此外高温也是硬盘损坏的重要原因。由于硬盘采用磁记录方式存储数据, 当温度升高时硬盘盘片上磁记录物质的热物理运动加强, 当热物理运动强度超出了磁力约束时,磁记录物质的排列方向和顺序被打乱, 数据就会丢失。运行过程中硬盘数据丢失现象往往同时伴随着风扇故障出现, 这是因为风扇故障在前, 之后因风扇故障产生的高温再导致硬盘数据丢失。因此只要解决了风扇故障问题,硬盘问题也会得到很大改善。至于外部振动引起硬盘损坏的说法,笔者认为概率相对较小,因为IPC工控机普遍在硬盘机架上安装了硬盘避振器和减震橡胶垫,能有效减轻振动对硬盘的损坏。除非在运行状态下人为敲打或晃动硬盘,否则不会硬盘造成影响。



2 现有IPC工控机故障解决方法

    对已投运的变电站计算机监控系统IPC工控机应采取防治结合,以防为主的方法。

    2.1 提高机箱散热效果

    (1)加强散热效果并延长风扇运行寿命。工控机的散热器几乎无一例外地采用铝合金散热片和自润轴承式风扇。铝合金散热片成本较低, 但热传导效率不尽如人意; 自润轴承式风扇价格便宜, 使用初期噪音较低, 但使用一段时间后由于内部润滑油挥发和外部灰尘的进入, 轴承磨损严重, 导致电机噪音增大,转速减缓,散热效率下降。通常这种风扇使用寿命只有8000~15000h左右,如不定期维护,无故障时间更短。

    因此有必要在机箱内部空间允许的前提下对散热器进行改造: 用纯铜多鳍片散热片替换铝合金散热片, 可有效提高热传导效率和增大散热表面积; 液压轴承风扇采用磁力支持悬浮作用原理再加上与之配合的特殊油膜润滑, 大大减小了轴承磨损, 使用寿命可达50000h以上, 并可有效降低因风扇转动产生的噪音和振动。这样的改造价格低廉,通常在400元以内, 得到的效果却非常好。但这些散热器往往体积较大, 通常只能用于卧式机箱, 对内部空间紧凑的一体化工控机并不适合。

    (2)加强对IPC工控机的实时监控。虽然无法以目测方式对机箱内部进行观察, 但通过技术手段仍可实现对IPC工控机的实时监控。在IPC工控机主板的不同位置安装有数个温度探头(或相应接口), 可通过主板BIOS内的温度监视选项对机箱内温度进行监视,当因风扇故障等原因导致机箱内温度超过设定值时主板蜂鸣器会发声报警; 主板BIOS也能对风扇转速进行实时监视, 当风扇转速低于设定值时主板蜂鸣器也会发声报警。某些型号IPC工控机还具备告警信号硬接点输出能力。此外IPC工控机的随机光盘都带有功能较为完善的状态监测软件, 应好好加以利用。

    2.2 保持板卡接触良好

    板卡接触不良主要由金手指表面氧化和机箱振动等原因造成。对于金手指表面氧化问题, 可以在工控机定期维护时对板卡进行重新插拔安装, 并用橡皮对板卡金手指部分进行擦拭, 去除氧化层。至于机箱振动, 除了定期对板卡紧固螺丝进行加固外, 还应从减少振动源方面入手。工控机振动主要来自于风扇和硬盘, 为减小风扇带来的振动, 可以考虑采用大扇页智能风扇。首先较大的扇页能在较低转速下产生较大风量, 达到普通风扇较高转速下的散热效果, 有效降低振动和噪音; 其次这种风扇配有智能芯片, 在对主板BIOS进行设定后能在设定温度范围内自动平稳地调节风扇转速, 只有当温度达到某一程度时, 才全速转动, 既提高了散热效率, 又减少了耗电量, 同时也降低了风扇的噪音和振动。此外由于硬盘普遍采用了液态轴承马达技术, 振动已大大减小, 并且工控机普遍在硬盘机架上安装了硬盘避振器和减震橡胶垫, 能有效减轻硬盘带来的振动, 因此其对板卡接触不良的影响程度基本可以忽略。



    2.3 预防硬盘数据丢失

    上述诸多措施可以在很大程度上解决因外部原因造成硬盘数据丢失和损坏的问题,但对于因硬盘电机磨损等原因造成的硬盘故障可以通过以下措施来解决:

    (1)使用企业级硬盘, 延长硬盘运行寿命。出于成本考虑,笔者接触过的IPC工控机无一例外都采用了普通硬盘, 并且检修维护人员在处理硬盘故障时往往是用普通硬盘更换。因为普通硬盘是根据每天8h运行目标设计和制造的, 不能满足IPC工控机全年24h运行要求。与普通硬盘相比, 企业级硬盘在I/O吞吐性能、大密度随机存取优化、多硬盘协同以及高强度负载下长期工作等指标上都有大幅度提高, 特别是振动和高温环境下MTBF(平均无故障运行时间)指标比普通硬盘高一个数量级,非常适合IPC工控机使用。

    (2)采用硬盘阵列(RAID)技术, 提高硬盘数据可靠性。在由2块硬盘组成的RAID 1系统中, 相同的数据被同时存储到两块硬盘上(即冗余)。当一个硬盘发生故障时,可立即从另一个硬盘上获得数据, 从而无损数据完整性。目前主流操作系统如:UNIX、WINDOWS NT及后续版本都能对RAID 1提供较好的支持而无需第三方软件。只需增加一块相同规格的硬盘和1块RAID卡(某些工控机可选主板集成RAID芯片), 就能大地提高硬盘容错功能,保证数据的可靠性。



    (3)通过SMART技术加强对硬盘的实时监视, 把故障消灭在萌芽状态。SMART技术的全称是Swif-Monitoring,Analysis and Reporting Technolopy,即硬盘“自我监测, 分析与报告技术”,该技术主要是为了排除硬盘中可预测的机械性故障(据统计这类可预测的故障大约占硬盘故障总数的60%以上) ,做到在这类故障发生之前提供警告, 从而保护数据内容不受损失。在主板BIOS、硬盘以及操作系统都支持并开启SMART技术的情况下,SMART可以监视硬盘磁头离盘片的距离,控制电路的工作状态以及数据的传输速率等等。在不良状态出现时,SMART技术能够在屏幕上显示相应告警信息,使运行维护人员能在故障发生前及时做出补救。目前WINDOWS 98及后续版本的WINDOWS操作系统均能较好地支持该技术,但UNIX操作系统尚无法支持。2000年之后生产的主板和硬盘都支持SMART技术。通过SMART技术, 可大大提高硬盘数据可靠性。

    2.4 加强对IPC工控机的维护

    检修部门通常采取一、二次设备检修同步进行的方式, 这种做法对于保护和测控等二次设备的定期检修比较合理, 但IPC工控机通常属于监控系统公用设备, 没有具体的一次设备与之对应, 因此在制定监控系统设备定期检修计划时容易发生遗漏, 使IPC工控机的维护处于非受控状态, 一直到机器发生故障才被动地去处理, 造成IPC工控机故障率一直居高不下。因此应从制度上加强对IPC工控机的维护力度。对于采用双机冗余方式运行的工控机,应制定检修计划,在保证运行安全的前提下定期对2台工控机轮流进行停机维护。维护内容包括机箱内部清扫、板件连接加固、风扇润滑油加注、进气滤网(或海绵)清洗、内部板卡元件检查等。

3 IPC工控机应用展望

    通过一系列有针对性的措施, 可以在很大程度上改善现有变电站计算机监控系统IPC工控机故障率居高不下的局面。不仅是IPC工控机, 变电站所有基于微机架构的计算机, 包括站级层主机、操作员站、独立五防微机、故障录波计算机等都可以采用上述方法来提高自身稳定性和可靠性。

    根据现有硬件技术条件,依据一段时间以来的运行实践经验,在变电站计算机监控系统的应用技术上应考虑满足以下发展趋势:

    (1)使用大容量闪存式硬盘代替常规硬盘,彻底解决常规硬盘带来的诸多问题。闪存在计算机及自动控制领域早已被广泛应用:计算机主板的BIOS程序以及保护和测控装置系统及应用程序均采用闪存进行存储,其可靠性和稳定性得到了一致认可。随着闪存技术的发展,闪存容量有了大提高,价格却直线下降。目前已量产大闪存硬盘已达到64GB,而4GB容量的闪存硬盘价格已跌至1000元以下,价格已不再是障碍。与传统硬盘相比,闪存体积小、功耗小,产生热量也少,尤其是它没有机械部件,不存在机械磨损之忧,并且读写无噪音,不会产生振动也不怕振动。但它的缺点是可擦写次数比传统硬盘少,约为100万次左右。因此闪存硬盘特别适合一次写入,多次读写的应用场合。而变电站计算机监控系统作为前置机和公用信息管理机的IPC工控机正好满足这个条件。首先从容量上来说,前置机/管理机运行所需的操作系统及应用软件安装所需容量一般不会超过3GB,使用4GB闪存硬盘即可满足需要, 并且安装完毕后更改次数较少。其次前置机/管理机在将程序和数据库文件从硬盘读到内存缓冲区后就不再对硬盘进行操作。这时即使硬盘发生损坏, 只要不重启计算机,前置机/管理机仍可正常运行。

    (2)无风扇的设计结构。由于大容量闪存式硬盘技术的应用,无噪音无振动,发热量小,IPC内部可以通过高效的被动散热结构进行散热而无需风扇。这样设备本身结构更加严密可靠, 不存在由于结构或振动原因引起的接触不良, 外部的灰尘、杂物也不会进入装置内部,运行更加稳定可靠。

    (3)嵌入式工控机的应用。嵌入式系统是以应用为中心,以计算机技术为基础,并且软硬件可裁剪, 适用于应用系统对功能、可靠性、成本、体积、功耗有严格要求的专用计算机系统。PC平台在一些可靠性要求高的工业领域,暴露出一些致命弊端:系统的不够稳定、功耗大散热差、系统的升级管理、病毒入侵的防治、设备结构不够严密精细等问题。而嵌入式CPU大多工作在为特定用户群设计的系统中, 通常都具有低功耗、体积小、集成度高等特点, 能够把通用CPU中许多由板卡完成的任务集成在芯片内部,从而有利于嵌入式系统设计趋于小型化, 移动能力大大增强, 跟网络的耦合也越来越紧密。嵌入式系统中的软件一般都固化在存储器芯片或单片机本身中, 而不是存贮于磁盘等载体中, 提高执行速度和系统可靠性。因此在变电站计算机监控系统这样可靠性、安全性、实时性要求高的领域, 嵌入式系统比PC系统技术更有优势。



    综上所述,设备选型时尽量避免PC工控机的使用,应考虑散热性能好、闪存存储、嵌入式系统、结构严密的装置型设备, 以提高电力系统运行设备的可靠性及工作寿命。南京研维销售全系列研华工控机,欢迎来电咨询产品选型和技术咨询;

企业分站 在线客服 :     服务热线: 025-86136252 / 15062244194     电子邮箱: [email protected]

公司地址:江苏省南京市江宁区未来科技城

研维信息是一家集研发、生产、销售为一体的工控机、嵌入式安装工业平板电脑、加固手持平板电脑、加固类三防计算机的专业设备提供商,提供各种尺寸和规格的安装式工业平板电脑,手持三防平板电脑,加固三防计算机。核心研发及市场团队均有10余年的相关行业背景,尤其是公司的ODM团队,可以为客户提供快速、质优、灵活的客户定制化产品OEM及ODM服务,公司对员工及客户,都一直秉承合作共赢、以德为先的经营宗旨,为客户提供优质产品及服务,提升客户价值。

关注研维微信公众号,掌握工控行业最新动态资讯
备案号:苏ICP备14059761号-8
主营区域:北京江苏浙江上海安徽山东四川广东福建天津河北河南湖南湖北陕西、山西、辽宁吉林江西黑龙江重庆内蒙古广西海南贵州云南新疆甘肃宁夏青海西安成都深圳杭州苏州广州武汉青岛东莞珠海宁波郑州
声明:(1)本站遵循《中华人民共和国广告法》,在标题、页面等文案描述中尽量规避违禁词、极限词,如还有违禁词、极限词,在此申明上述词汇表述全部失效,如客户咨询均表示默认此条款,不支持任何形式以违禁词、极限词等理由投诉或要求收取费用私下解决,特此申明!(2)除非研维公司另行申明,本网站内的所有产品、技术、软件、程序、数据及其他信息(包括文字、图标、图片、照片、音频、视频、图标、色彩组合、版面设计等)的所有权利(包括版权、商标权、专利权、商业秘密及其他相关权利)均归研维公司所有。未经研维公司的许可,任何人不得以包括通过机器人、人力等程序或设备监视、复制、传播、展示、镜像、上载、下载等方式擅自使用本网站的任何内容。一旦发现侵权行为,我司将立即进行证据保全并诉诸法律。
在线客服