近来有同行朋友探讨伺服器的维修,而大多维修界的前辈们,总把维修伺服器看得很神秘,很高深的样子,对技术是守口如瓶。我想在这里抛砖引玉,探讨伺服器的原理和维修。 我是一个搞工业控制设备维修的,专长是硬件维修。工业设备最初源起欧美,发扬于日本,所以无论理论也好,设计也罢,都绕不开国外这个词。在如今网络,软件,物联网,虚拟现实的今天,很多人对硬件维修人员,大多嗤之以鼻。以为就是个玩玩烙铁的体力活,没多少技术含量,其实硬件维修道路艰险且漫长,需要了解的实在很多。 硬件是工业控制设备中重中之重的课题,是虚实交互的桥梁,没这座桥一切都是空谈,是绕不开的执行工具,硬件质量的好坏,直接关系到处理结果。现在世界上顶级的工控设备生产商,都在向模块化生产靠拢。 什么是模块化呢?简单点说就是:把一个设备分拆为几个部分,每个部份,集成起来生产组合起来。这样的好处是,可尽量控制设备的故障范围,节省维护成本,同时拓展了用途。这点在需要联控的领域优势非常的明显。 很多人进入工业设备维修的领域,都是从修变频器开始的,也有人认为会修变频器就会修所有的工业控制设备,其实,这仅仅是一个开始。当然,入门级变频器包括了强电/微电电路/反馈取样/本地远程控制等基本功能。通常用在要求运转精度不高的场合,比如供水,调速等场合。但一些精确控制场合就不同了,要知道工业控制的精髓就是,精确控制。没有精确度,纵使外观漂亮大气,吹得如何天花乱坠,你的产品还是低级产品。有精度要求的场合,比如我们常常乘坐的电梯,起重,造纸,冶金,纺织等有严格要求的场合,普通变频器就往往不能胜任了。这时,就要求伺服控制器登场了。 伺服控制器有那么神乎其神吗?也别把那东西想得那么复杂,伺服的基本条件是闭环控制。什么是闭环控制?无非就是和输出马达组合成一个环路,有反馈而已。变频器也有反馈,比如电流传感器就是。伺服的反馈要求更苛刻一些,要求电机每转动一下的位置信息主控制板都要知道。通俗点说就是:快了就慢下来,慢了就加快一点。这个说起来容易做起来难,要知道动态,惯性,负载变化都在瞬息万变,马达那边出了什么幺蛾子,控制器马上就知道,而且要做出对应的处理措施,这并不是一件容易的事。 于是第二个问题就出来了,那就是响应问题。所谓的响应,就如人与人之间的对话,一问一答。马达运行起来那是每分钟几千转的问题,这就是所谓的高速响应。马达的编码器担负起和主控板之间的对话。编码器制造商按要求将编码器演算成脉冲,马达转一圈,很可能编码器就输出了几千个脉冲,这个脉冲以原始位置为起点,每一个脉冲代表一个位置。你也可以这样理解,编码器每圈输出的脉冲越多,定位越准确,误差越小。当然以上说的指示一个概念,实际的软件算法,硬件制造工艺要求,那是相当的复杂的。不过那对与维修工程人员来说,用处不大,但需了解原理。 光说理论没用,维修的时候,还会遇上各种编码器,什么绝对编码器,增量编码器,通讯式编码器,旋转变压器等等。所以有人说,工业设备的维修技术,一半是理论,一半是经验。在现实维修中,很多事情是没时间给你去慢慢推敲理论,客户要你一看故障结果,就需要判断出故障点。个人经验,在日本美国产品中,习惯用编码器作为反馈器件,代表如三菱,安川,松下等等。欧洲的一些顶级伺服制造商,非常习惯用旋变(解析器)作为反馈器件,比如伦茨,路斯特,科比等等。对于反馈器件的使用,不敢说谁更胜一筹。但稳定性来说,旋转变压器应该稳定一些。但旋变的a/d运算复杂,制作成本也较高,所以一般都只出现在高级的伺服控制器中。 伺服控制器维修,怎样分析故障? 伺服器的维修,和变频器最大的不同就是没有马达无法试机,而作为维修公司,你不可能备有所有型号的伺服马达,试机是一个绕不开的坎。更让人恼火的是,你不连接编码器,编码器的故障报警会掩盖其他所有故障报警。我的做法是先询问客户,伺服器现场故障情况,比如现场根本没有出现过编码器相关的故障信息,维修时,你就根本不用考虑编码器问题。报警过载过流,电压低,无法定位,无法启动这些故障,我一般直接找故障点,然后反向推理一到两步,为什么会出现这个故障报警。 下面说几个列子,来分析一下维修伺服器的思路。 1.一台伦茨93es系列伺服器,客户说速度不稳定,电流时大时小,然后出现过载,客户还说编码器已经换了,强调编码器是好的。 伺服器能运行起来,那就证明输出驱动,IGBT没有问题的,电流不稳定,一般来说是电流取样电路的故障。但伦茨有一个缺点,就是只使用了两相电流传感器,如果其中的一个传感器有了故障,一般功率模块也就报废了。虽然纳闷,也没有深究,先拆下模块,做霍尔动态检测,波形,幅值完全正常。不放心,将驱动6个桥臂全部检查,也正常。余下的就是主板的反馈输入接口了。经过反复检测,也正常。于是装机,开环带灯,正常,试电机也正常。一个上午过去了,可以说没有找到故障,于是让客户拿走。 客户回去不久就打电话,说故障依旧。事情蹊跷,这下必须得去现场了。到了现场,让客户开机,空载正常,低速也正常,但电流也波动。经过仔细观察,居然被我看出了问题,原来客户修改了生产产品规格,由于位置的改变,工厂电工将增量编码器改为了软连接,且中点不同心了。低速的时候还是可以的,高速的时候造成抖动,使编码器输出信号出错。 纠正了客户使用方式,一切恢复正常。记住,伺服器是软硬件和外部设备相连接起控的,当自己费了九牛二虎之力也没找到故障时,就该考虑一下外部有没有问题了。 2.一个客户发了台路斯特C系列伺服器过来维修,故障是使用时出现过载停机,每次故障前,马达会出现震动和噪声。停机一段时间又可以开机。 德国路斯特伺服器性能可靠,唯一一个缺点是容易掉用户程序。能冷机开机,让人很容易想到是不是散热的问题。当接到用户发过来的伺服器后,我打消了这个想法。一来这个伺服器较小,只有400w,根本没有散热风扇。二是详细询问后发现,出现故障的时间不定。如果伺服器散热故障,一般时间是固定的,不如说使用二十分钟一定报警。开机后发现,a/d转换芯片的供电电阻已经烧焦,测量仅阻值变大而已,电压小了,换新后,供电电压恢复正常。但经过分析,这个故障点和过载报警根本扯不上什么关系。路斯特马达一般采用旋变反馈,旋变是很不容易出现问题的。自己维修那么多,旋变从来没坏过,检查编码器连线,居然发现了一条电缆是半开路的,心里一喜,以为找到了故障。因为有匹配的电机,那就试机吧。切换到手动状态,闭合启动,将转速设定到2000转,然后关门下班。第二天一早查看,电机转速正常,马达温度也正常。于是拍下视频发给客户验收,付款发货。 回去没有两天,客户就打来电话,说故障依旧,这下傻眼了,怎么可能呢?后来经过和客户反复沟通,原来还是编码器线故障。因为我查出故障这条编码器线原来换过,我修复发回后,工厂技术人员懒得去拆那条编码器线,结果故障还是那个故障。换线后,设备正常工作。对于远方的客户,我一般修复会拍视频,型号,系列号,运行状态,给客户验收,然后再收款发货。但有的时候,测试正常和现场使用一定要沟通好。 3.有客户拿了一台提花机专用,叫answer(安速)伺服器过来维修,故障是没有显示。answer这个品牌,是松下伺服的血脉演化而来的,程序架构和应用都差不多。因为提花机已经国产且伺服用量较大,安速这个品牌就和提花机滋润的活到了现在。 没显示肯定电源出了故障,伺服器为了节省空间,很多都采用集成式电源ic,其中又以top24x型号的芯片最多。top24xy的芯片脚位一样,可以通用,不同的型号无非就是输出功率不同而已。换掉top246y,电源正常,测电流检测环路正常,让用户取走。上机,居然报警13,13是母线电压过低,调换控制器工作正常。看样子的确还有故障,拿回来检测母线取样电路,发现母线检测正常。百思不得其解,只得将硬件通路重新检测一番。影响伺服的硬件工作条件的故障依序是:编码器,母线检测,温度检测,电流检测,驱动电路。用排除法一一排除,最后锁定在驱动输出上。我的理由是:伺服输出报警13,可能是输出电流过大,电流过大电压降低,由于伺服没有旋转起来,此时电压检测优先于电流检测。目标清晰了以后,仔细查看,最后故障果然出现在驱动光耦上pc929上,换新,故障排除。 实践告诉我,有的故障报警,是互相关联的,逻辑上存在优先报警级别。有时自己看到的故障提示,并不是故障本身。伺服器维修,其实也没那么复杂,真要遇上了复杂的故障,也大可不必惊慌,大不了带马达测试再维修。 作为维修人员来说,原理是必需要知道的,弄懂工作原理可以参考相关的技术书籍。现场使用需要会一点点(应用工程师需要熟悉应用,这点和维修不同),我的经验是反复看一个牌子的使用手册,看懂了不敢说一通百通,但对同品牌的伺服控制器,本来就有很多相通的地方,完全可以灵活借鉴。故障优先级别需要在实践中去总结,凡事往后推理三步,一切原形毕露!反馈器件类型很多,按说明书选择即可。工业制造在不断的升级,伺服控制器用得越来越普遍,对维修工程师来说,大多数的伺服其实是不需要匹配马达测试,就能找到故障点的。 只要你明白了这些,哈哈,套用徐志摩先生话说就是:你不必讶异,更无须惊喜,在转瞬间修好了一个伺服器…… |