網(wǎng)元層故障管理模塊的軟件可靠性設(shè)計(jì)技術(shù)
發(fā)布時(shí)間:2008/5/27 0:00:00 訪問次數(shù):449
    
    典型的gsm/cdma移動(dòng)通信網(wǎng)由交換分系統(tǒng)、基站分系統(tǒng)和大量移動(dòng)用戶終端三大部分組成。其中,交換分系統(tǒng)也稱為移動(dòng)交換系統(tǒng)(mss),由移動(dòng)交換中心(msc)、歸屬位置寄存器(hlr)、被訪位置寄存器(vlr)、設(shè)備識(shí)別寄存器(eir)、鑒權(quán)中心(auc)、短消息中心(smsc)等諸多網(wǎng)絡(luò)元素(network element,簡稱為網(wǎng)元)和操作維護(hù)中心(omc)構(gòu)成。交換分系統(tǒng)是移動(dòng)通信系統(tǒng)的控制交換中心,也是移動(dòng)網(wǎng)與其他通信網(wǎng)的接口。交換分系統(tǒng)中任何一個(gè)網(wǎng)絡(luò)元素出現(xiàn)故障都有可能對(duì)整個(gè)移動(dòng)通信系統(tǒng)產(chǎn)生嚴(yán)重影響。在交換分系統(tǒng)中,操作維護(hù)中心和各網(wǎng)元實(shí)體上的故障管理模塊是網(wǎng)元層網(wǎng)絡(luò)管理系統(tǒng)的一個(gè)重要組成部分。本文以移動(dòng)交換系統(tǒng)網(wǎng)元層故障管理模塊為例,介紹在實(shí)時(shí)系統(tǒng)的軟件設(shè)計(jì)過程中,在保證系統(tǒng)實(shí)時(shí)性的前提下,提高軟件系統(tǒng)可靠性的一些軟件設(shè)計(jì)技術(shù)。 1故障管理模塊概述
    故障管理模塊在交換分系統(tǒng)中所處的位置如圖1所示。
    
    
    故障管理模塊存在于omc和各網(wǎng)元實(shí)體之上。omc上的故障管理模塊一般設(shè)計(jì)為客戶端/服務(wù)器(c/s)結(jié)構(gòu),其實(shí)現(xiàn)的功能包括:故障信息的持久性保存(一般是寫入數(shù)據(jù)庫)、故障信息的顯示、網(wǎng)元機(jī)架圖的顯示等。網(wǎng)元上的故障管理模塊負(fù)責(zé)收集各業(yè)務(wù)進(jìn)程和控制進(jìn)程產(chǎn)生的故障信息,經(jīng)過處理后把這些故障信息轉(zhuǎn)發(fā)到omc。故障信息也稱為告警消息。一條告警消息在c++中表現(xiàn)為-對(duì)象,包括告警發(fā)生時(shí)間、恢復(fù)時(shí)間、發(fā)生位置和流水號(hào)等若干屬性。
    
    故障管理模塊是監(jiān)控交換分系統(tǒng)是否正常工作的主要工具,是電信運(yùn)營商非常重視的一個(gè)軟件模塊。電信運(yùn)營商對(duì)故障管理功能的最基本的要求就是:實(shí)時(shí)準(zhǔn)確,不漏警,不虛警。為了達(dá)到這個(gè)要求,故障管理模塊的設(shè)計(jì)必須在保證實(shí)時(shí)性的基礎(chǔ)上,確保故障信息的準(zhǔn)確無誤。
    
    2 網(wǎng)元上故障管理模塊的設(shè)計(jì)和實(shí)現(xiàn)
    
    交換分系統(tǒng)中的各種網(wǎng)元實(shí)體(如msc、hlr等)都是典型的分布式實(shí)時(shí)系統(tǒng),一般由若干個(gè)模塊構(gòu)成。交換分系統(tǒng)中的設(shè)備都要求全年24小時(shí)不間斷工作,所以每個(gè)模塊都采用了主機(jī)備用冗余的設(shè)計(jì)。網(wǎng)元中故障管理模塊的結(jié)構(gòu)示意圖如圖2所示。每個(gè)模塊都有主用和備用2個(gè)模塊處理機(jī)(mp),2個(gè)模塊處理機(jī)同時(shí)處于工作狀態(tài)。備用mp只和主用mp通信,負(fù)責(zé)備份主用mp中的重要數(shù)據(jù)。一旦主用mp發(fā)生故障,備用mp可以在不中斷業(yè)務(wù)的情況下迅速地轉(zhuǎn)為主用工作狀態(tài)。
    
    
    從圖中可以看出,故障管理模塊同時(shí)運(yùn)行在主用和備用mp中。故障管理模塊在mp中用3個(gè)進(jìn)程實(shí)現(xiàn)。
    
    (1)告警收集進(jìn)程:收集各業(yè)務(wù)進(jìn)程和單板控制進(jìn)程產(chǎn)生的告警信息,進(jìn)行必要的格式轉(zhuǎn)換等數(shù)據(jù)預(yù)處理工作,然后把處理后的告警信息放入當(dāng)前告警列表和消息發(fā)送隊(duì)列。當(dāng)前告警列表存儲(chǔ)在mp內(nèi)存中的一個(gè)數(shù)據(jù)緩沖區(qū)。主用和備用mp中的告警數(shù)據(jù)緩沖區(qū)總是處于一致狀態(tài)。
    
    (2)告警發(fā)送進(jìn)程:主要的任務(wù)是將告警發(fā)送隊(duì)列中的告警消息發(fā)送到omc上的故障管理模塊。
    
    (3)告警同步進(jìn)程:主要完成網(wǎng)元和omc之間告警消息的周期性同步、斷鏈同步處理以及主用和備用mp之間的周期性同步和倒換同步處理。該進(jìn)程是實(shí)現(xiàn)不漏警、不虛警要求的重要機(jī)制。
    
    3 omc中故障管理模塊的設(shè)計(jì)和實(shí)現(xiàn)
    
    omc設(shè)計(jì)為c/s結(jié)構(gòu)。故障管理模塊同時(shí)存在于客戶端和服務(wù)器上,分別用不同的應(yīng)用進(jìn)程實(shí)現(xiàn)。服務(wù)器上的故障管理模塊實(shí)現(xiàn)的功能有:保存告警信息到數(shù)據(jù)庫;轉(zhuǎn)發(fā)告警信息到上一級(jí)的網(wǎng)絡(luò)管理中心;轉(zhuǎn)發(fā)告警信息到客戶端;處理客戶端的數(shù)據(jù)庫操作請(qǐng)求和參數(shù)修改請(qǐng)求;控制告警箱等?蛻舳说墓收瞎芾砟K實(shí)現(xiàn)的功能有:最新告警的實(shí)時(shí)顯示;歷史告警的查詢和打;告警屏蔽設(shè)定和解除;機(jī)架圖的實(shí)時(shí)顯示;人機(jī)命令界面等。
    在c/s結(jié)構(gòu)的系統(tǒng)中,服務(wù)器處于核心地位,服務(wù)器端的故障管理進(jìn)程要確保能長時(shí)間正常工作。在omc系統(tǒng)中,可以使用看門狗機(jī)制監(jiān)控故障管理進(jìn)程?撮T狗實(shí)際上是一個(gè)錯(cuò)誤監(jiān)控程序,可以用一個(gè)高優(yōu)先級(jí)的應(yīng)用進(jìn)程來實(shí)現(xiàn)?撮T狗進(jìn)程定時(shí)向故障管理進(jìn)程發(fā)送握手消息,故障管理進(jìn)程收到
    
    典型的gsm/cdma移動(dòng)通信網(wǎng)由交換分系統(tǒng)、基站分系統(tǒng)和大量移動(dòng)用戶終端三大部分組成。其中,交換分系統(tǒng)也稱為移動(dòng)交換系統(tǒng)(mss),由移動(dòng)交換中心(msc)、歸屬位置寄存器(hlr)、被訪位置寄存器(vlr)、設(shè)備識(shí)別寄存器(eir)、鑒權(quán)中心(auc)、短消息中心(smsc)等諸多網(wǎng)絡(luò)元素(network element,簡稱為網(wǎng)元)和操作維護(hù)中心(omc)構(gòu)成。交換分系統(tǒng)是移動(dòng)通信系統(tǒng)的控制交換中心,也是移動(dòng)網(wǎng)與其他通信網(wǎng)的接口。交換分系統(tǒng)中任何一個(gè)網(wǎng)絡(luò)元素出現(xiàn)故障都有可能對(duì)整個(gè)移動(dòng)通信系統(tǒng)產(chǎn)生嚴(yán)重影響。在交換分系統(tǒng)中,操作維護(hù)中心和各網(wǎng)元實(shí)體上的故障管理模塊是網(wǎng)元層網(wǎng)絡(luò)管理系統(tǒng)的一個(gè)重要組成部分。本文以移動(dòng)交換系統(tǒng)網(wǎng)元層故障管理模塊為例,介紹在實(shí)時(shí)系統(tǒng)的軟件設(shè)計(jì)過程中,在保證系統(tǒng)實(shí)時(shí)性的前提下,提高軟件系統(tǒng)可靠性的一些軟件設(shè)計(jì)技術(shù)。 1故障管理模塊概述
    故障管理模塊在交換分系統(tǒng)中所處的位置如圖1所示。
    
    
    故障管理模塊存在于omc和各網(wǎng)元實(shí)體之上。omc上的故障管理模塊一般設(shè)計(jì)為客戶端/服務(wù)器(c/s)結(jié)構(gòu),其實(shí)現(xiàn)的功能包括:故障信息的持久性保存(一般是寫入數(shù)據(jù)庫)、故障信息的顯示、網(wǎng)元機(jī)架圖的顯示等。網(wǎng)元上的故障管理模塊負(fù)責(zé)收集各業(yè)務(wù)進(jìn)程和控制進(jìn)程產(chǎn)生的故障信息,經(jīng)過處理后把這些故障信息轉(zhuǎn)發(fā)到omc。故障信息也稱為告警消息。一條告警消息在c++中表現(xiàn)為-對(duì)象,包括告警發(fā)生時(shí)間、恢復(fù)時(shí)間、發(fā)生位置和流水號(hào)等若干屬性。
    
    故障管理模塊是監(jiān)控交換分系統(tǒng)是否正常工作的主要工具,是電信運(yùn)營商非常重視的一個(gè)軟件模塊。電信運(yùn)營商對(duì)故障管理功能的最基本的要求就是:實(shí)時(shí)準(zhǔn)確,不漏警,不虛警。為了達(dá)到這個(gè)要求,故障管理模塊的設(shè)計(jì)必須在保證實(shí)時(shí)性的基礎(chǔ)上,確保故障信息的準(zhǔn)確無誤。
    
    2 網(wǎng)元上故障管理模塊的設(shè)計(jì)和實(shí)現(xiàn)
    
    交換分系統(tǒng)中的各種網(wǎng)元實(shí)體(如msc、hlr等)都是典型的分布式實(shí)時(shí)系統(tǒng),一般由若干個(gè)模塊構(gòu)成。交換分系統(tǒng)中的設(shè)備都要求全年24小時(shí)不間斷工作,所以每個(gè)模塊都采用了主機(jī)備用冗余的設(shè)計(jì)。網(wǎng)元中故障管理模塊的結(jié)構(gòu)示意圖如圖2所示。每個(gè)模塊都有主用和備用2個(gè)模塊處理機(jī)(mp),2個(gè)模塊處理機(jī)同時(shí)處于工作狀態(tài)。備用mp只和主用mp通信,負(fù)責(zé)備份主用mp中的重要數(shù)據(jù)。一旦主用mp發(fā)生故障,備用mp可以在不中斷業(yè)務(wù)的情況下迅速地轉(zhuǎn)為主用工作狀態(tài)。
    
    
    從圖中可以看出,故障管理模塊同時(shí)運(yùn)行在主用和備用mp中。故障管理模塊在mp中用3個(gè)進(jìn)程實(shí)現(xiàn)。
    
    (1)告警收集進(jìn)程:收集各業(yè)務(wù)進(jìn)程和單板控制進(jìn)程產(chǎn)生的告警信息,進(jìn)行必要的格式轉(zhuǎn)換等數(shù)據(jù)預(yù)處理工作,然后把處理后的告警信息放入當(dāng)前告警列表和消息發(fā)送隊(duì)列。當(dāng)前告警列表存儲(chǔ)在mp內(nèi)存中的一個(gè)數(shù)據(jù)緩沖區(qū)。主用和備用mp中的告警數(shù)據(jù)緩沖區(qū)總是處于一致狀態(tài)。
    
    (2)告警發(fā)送進(jìn)程:主要的任務(wù)是將告警發(fā)送隊(duì)列中的告警消息發(fā)送到omc上的故障管理模塊。
    
    (3)告警同步進(jìn)程:主要完成網(wǎng)元和omc之間告警消息的周期性同步、斷鏈同步處理以及主用和備用mp之間的周期性同步和倒換同步處理。該進(jìn)程是實(shí)現(xiàn)不漏警、不虛警要求的重要機(jī)制。
    
    3 omc中故障管理模塊的設(shè)計(jì)和實(shí)現(xiàn)
    
    omc設(shè)計(jì)為c/s結(jié)構(gòu)。故障管理模塊同時(shí)存在于客戶端和服務(wù)器上,分別用不同的應(yīng)用進(jìn)程實(shí)現(xiàn)。服務(wù)器上的故障管理模塊實(shí)現(xiàn)的功能有:保存告警信息到數(shù)據(jù)庫;轉(zhuǎn)發(fā)告警信息到上一級(jí)的網(wǎng)絡(luò)管理中心;轉(zhuǎn)發(fā)告警信息到客戶端;處理客戶端的數(shù)據(jù)庫操作請(qǐng)求和參數(shù)修改請(qǐng)求;控制告警箱等?蛻舳说墓收瞎芾砟K實(shí)現(xiàn)的功能有:最新告警的實(shí)時(shí)顯示;歷史告警的查詢和打。桓婢帘卧O(shè)定和解除;機(jī)架圖的實(shí)時(shí)顯示;人機(jī)命令界面等。
    在c/s結(jié)構(gòu)的系統(tǒng)中,服務(wù)器處于核心地位,服務(wù)器端的故障管理進(jìn)程要確保能長時(shí)間正常工作。在omc系統(tǒng)中,可以使用看門狗機(jī)制監(jiān)控故障管理進(jìn)程?撮T狗實(shí)際上是一個(gè)錯(cuò)誤監(jiān)控程序,可以用一個(gè)高優(yōu)先級(jí)的應(yīng)用進(jìn)程來實(shí)現(xiàn)?撮T狗進(jìn)程定時(shí)向故障管理進(jìn)程發(fā)送握手消息,故障管理進(jìn)程收到
熱門點(diǎn)擊
- 用代理服務(wù)器及瀏覽器隱藏IP地址的方法
- U/V段業(yè)余中繼通訊初探
- 一卡通郵政綜合服務(wù)系統(tǒng)
- 基于Modbus協(xié)議實(shí)現(xiàn)單片機(jī)與PLC之間的
- SJA1000在CAN總線系統(tǒng)節(jié)點(diǎn)的應(yīng)用
- DTMF遠(yuǎn)程通信的軟硬件實(shí)現(xiàn)技術(shù)
- A5191HRT型HART調(diào)制解調(diào)器的原理與
- 利用調(diào)頻立體聲基帶傳送數(shù)據(jù)信息的原理及實(shí)現(xiàn)
- RS-232串行通信消除干擾噪聲的設(shè)計(jì)方法分
- RS422/RS485網(wǎng)絡(luò)的無極性接線設(shè)計(jì)
推薦技術(shù)資料
- 電源管理 IC (PMIC)&
- I2C 接口和 PmBUS 以及 OTP/M
- MOSFET 和柵極驅(qū)動(dòng)器單
- 數(shù)字恒定導(dǎo)通時(shí)間控制模式(CO
- Power Management Buck/
- 反激變換器傳導(dǎo)和輻射電磁干擾分析和抑制技術(shù)
- 多媒體協(xié)處理器SM501在嵌入式系統(tǒng)中的應(yīng)用
- 基于IEEE802.11b的EPA溫度變送器
- QUICCEngine新引擎推動(dòng)IP網(wǎng)絡(luò)革新
- SoC面世八年后的產(chǎn)業(yè)機(jī)遇
- MPC8xx系列處理器的嵌入式系統(tǒng)電源設(shè)計(jì)
- dsPIC及其在交流變頻調(diào)速中的應(yīng)用研究