计算机论文:在线健康监测与故障管理在武器系统中的应用设计
来源:未知 2020-12-05 10:50
在线健康监测与故障管理(简称PHM)技术,已经成为新一代飞行器系统设计和使用中的一个重要组成部分[1,2]。在压制武器系统的应用中,可以依靠自身的电路和程序完成故障检测和隔离
计算机论文:在线健康监测与故障管理在武器系统中的应用设计
1引言
在线健康监测与故障管理(简称PHM)技术,已经成为新一代飞行器系统设计和使用中的一个重要组成部分[1,2]。在压制武器系统的应用中,可以依靠自身的电路和程序完成故障检测和隔离定位,能预测部件性能下降或故障即将发生的情况,估计装备的剩余使用时间或者正常工作时间长度,指导维修保障人员进行决策,将故障扼杀在摇篮里。这对提高战场状态武器系统的可靠性,进而赢得作战先机具有重要意义。
2健康监测与故障管理设计
健康监测与故障管理具备以下功能:通过机内测试(BIT)技术获取设备自主发送的状态信息、自检命令结果、检测结果等;通过请求被检测系统转入故障诊断状态,使其处于已知的确定状态,从而完成故障诊断;通过记录被检测设备的故障参数,实现故障数据的积累,进而开展装备故障预测方法的研究。
健康监测(HM)功能的故障检测机制(FDM)分布在系统的各个地方,一旦出现一个故障或错误均能立即发现并向武器系统的健康监控服务报告故障。故障检测机制通过基本硬件电路和软件程序实现。图1 是某武器系统内GSM模块的故障检测机制分布图
驻留在应用层的FDM是为专门的应用编写的,而驻留在OSL和BSP的FDM是通用的、针对所有应用的。故障报告动作可以是主动的,也可以是被动的。主动的是指FDM故障检测程序自身检测到故障的发生,被动的是指系统中发生的故障触发了故障检测机制的执行程序代码。
对于应用层的故障检测机制,因为是与特定应用相关的,所以是由用户自己提供,操作系统只负责给应用任务的FDM提供报告故障的手段,例如:APEX接口中的REPORT APPLICATION MESSAGE 服务。
故障检测机制FDM将故障上报给本模块操作系统的健康监控服务(OS-HM),然后由操作系统的健康监控服务负责通知GSM的健康监控进程(HM),同时操作系统的健康监控服务也要给GSM的健康监控进程(HM)提供故障诊断信息。
另外,GSM-HM的一个功能就是周期地监视系统的健康状况,健康监视是通过上下级的HM互相发送生命消息来实现的,目的是实时检测系统的故障。上层HM通过定期的发送“Are You Alive”消息到它的每个下层的HM。下层HM接到“Are You Alive"消息后用“I Am Alive"消息应答。当上层HM接收不到下层HM的“I Am Alive”消息就向系统报告生命消息错。
当模块收到故障信息后,通过BIT系统进行故障检测与隔离定位,根据故障模式分析进而发出容错或者系统重构的命令,实行故障管理。武器系统中各模块的健康情况由模块级的健康监测(HM)模块获取,通过I2C总线采集电子设备上电自检信息、工作状态信息实现被监测设备工作状态,判断设备软硬件健康情况,这些健康状态信息被HM模块报告给模块级的故障管理(FM)模块,由FM进行故障分析和故障处理,并将故障处理结果上报给系统级的HM模块,由HM统一整合后发送给系统级的FM模块,由其进行系统级的故障分析和处理。如果无法解决故障,系统级的FM模块会向应用管理(AM)模块请求重构,由AM选择重构决策,并控制应用的运行,然后向系统级的重构管理(CM)模块发出重构命令,由系统级的CM向其它模块级的CM下发重构命令,再由模块级的CM控制自身模块的重构过程。模块级的HM除向自身FM报告模块健康状态外,还会直接向HM报告BIT检测情况。
3故障过滤设计
故障检测与隔离采用故障树原理进行,演绎法建立火控系统故障树[3,4],建立模块级、单元级的逻辑关系和层次结构如下图1
图1某功能失效故障树
每测量一个节点参数进行一次判断,一旦找到故障,诊断过程即可结束,当一些故障只与少数特征有关时,诊断过程完成较快,从而缩短了诊断时间。
上下级HM除了周期地互相发送生命消息,监视系统的健康状况外,最主要的功能就是过滤故障,过滤掉瞬时故障,将确认的故障报告给同级的FM。故障过滤是通过一组或多组过滤器完成。过滤器对故障的过滤分为主动过滤和周期过滤两种,主动过滤用来确认故障,周期过滤用来虑除瞬时故障。过滤组和每个过滤器的过滤算法在CSCI中定义,具体包括增量、减量、门限值和周期值等。经过故障过滤能够大大降低系统的虚警率。图2是HM一个过滤器的过滤算法
图2过滤算法
在这个过滤器的过滤算法中,设定一个门限值,一个周期内每出现一次故障(同一故障),故障累积值就增加一个值,当累积值超过门限时,故障得到确认。当紧随出现故障周期的第二个周期没有再出现故障时,开始进行周期过滤,当故障累积值小于等于零时,清除故障记录。
4成果验证
硬件故障注入需要昂贵的硬件开销,所以采用软件故障注入的方式,通过调用相关函数模拟各类硬件故障可以实现不同故障的注入,使得验证结果更具说服力。统计检测结果如下表
注入故障类型 |
次数 |
检测并隔离出次数 |
故障检测率 |
供电电压故障 |
100 |
100 |
100% |
CPU故障 |
100 |
100 |
100% |
存储器故障 |
100 |
100 |
100% |
接口故障 |
100 |
100 |
100% |
故障显示与记录 |
20 |
20 |
100% |
瞬时故障过滤功能 |
100 |
95 |
95% |
通过数据可知,本次设计中武器系统的故障检测率和隔离率达到了100%,故障过滤算法使得虚警率控制到95%。由于样本数量有限,所以后续仍需要完善验证测试,使得健康监测与故障管理设计成果更具说服力。
5结论
航天系统中健康监测与故障管理技术已经应用的十分广泛[5],但目前在压制武器系统中的应用还不够完善,设计经验不足,将该设计应用到某型武器系统的火控系统中后增强了火控计算机的可测试性和可靠性,具有一定的实用价值,能够解决传统武器系统故障诊断技术的局限,适应压制武器装备的技术发展与需要,可以更好地保障武器系统运行降低维护成本,具有重要意义和广泛的应用前景。