平时,我们遇到SDH网络出现故障的时候,往往是根据网管的性能和告警信息,或者利用仪表测试,对故障点进行定位,然后进行处理。这里我们换一种思维方式,当网络中某个地方出现问题的时候,会出现哪些性能或告警信息呢?看看下面这个例子:
图1 问题模型
如图1所示,这是一个有4个点组成的SDH链网,TM1与TM2之间开通的是2M电路,ADM站点是TU-12的交叉连接。如果在A点加一个扰动,那么网管能从REG点检测到哪些性能值(B1、B2、B3、V5)?B点和C点的在线SDH测试仪又能检测到哪些性能值(B1、B2、B3、V5)?(不定向选择)如果ADM点没有TU-12交叉连接,只有AU-4的交叉连接,结果有没有变化呢?看完以下的内容,也许您就明白了。
二、深入理解SDH告警、性能与SDH开销的关系
在SDH设备中,除了信号丢失等告警信号外,其余所有的告警及性能都在SDH帧的开销中得到体现,并根据开销在每个网元的处理将开销字节终结、重新向下一个网元发起(前被终结的内容重新发起)、以及回送对告信息。
告警及性能的产生:根据当前光纤、支路线路的状态,以及根据误码的算法,要么向网管发出告警信息,要么向相应的开销字节写入内容同时向网管上报数值。
开销字节的终结即是将开销提取出来,上告网管报告为告警及性能记数,如需要的话,对SDH发出相应的保护倒换(同样是通过写开销字节来达到目的)等动作。
开销字节的重新发起即是将本网元已经终结的字节按照当前状态写入,或重新进行性能的记数等,然后发给下一网元。
回送对告信息即是在收到对端的各种告警及性能记数(如B2、B3、V5性能以及K2状态)后,根据SDH开销字节的含义,将对告的信息写入对告的字节(如M1、G1、REI、K2等)里,通过光纤发往对端。
如上图,以B点为需要描述的网元:对B点来说,A点以及光纤、支路线路是告警以及性能的发起源(C点与A点同),B点根据SDH标准处理某部分开销字节,从处理的开销字节中得到相应的告警及性能记数,上报网管,并在此处将此部分开销内容终结,及不往下一个站点下发,其余的未处理开销根据交叉直通等不做改变的发到下一个网元,如C网元。同时B点将需要对告的信息写入A的帧开销中,发往A点,A点得到一些对告的告警及性能,即在网管上产生相应的远端告警及远端性能。
同样B点接收到从C点发来的开销同样处理。A、C点同样如B点描述。
三、各类告警和性能的产生机理和处理方法
1. LOS:信号丢失告警。
表示本端接收不到光或电信号。当信号幅度在给定时间(例如10ms或更长)内一直低于某一设定门限值(使BER劣于10-3)时,则SDH设备应进入LOS状态。如果检测到2个连续的有效的帧定位图案并且没有检测到LOS时,则SDH设备应退出LOS状态。
(1)光口LOS
网管告警为:光接受信号丢失、低光输入
主要引起的原因是:光纤断、对端发送光信号没有、本端光收模块坏、接收到光信号与光模块速率等级不同。
处理方法:
先将本端用一根光纤自环,若告警消失,表示本端是好的,问题在对端。若对端自环也好,则可以肯定两端间光纤的断了;若对端自环不好,也是LOS告警,用光功率计测量其光发功率,若功率过小(-50dB或更低)则可断定光发坏了;若功率正常,则是由于没有时钟引起的,换掉时钟板,告警消失。
若本端自环还是LOS告警,则是由于光收模块坏了,更换后告警消失。
(2)电口LOS
网管告警为:2M终端信号丢失
检测PDH一侧是否有信号由接口送入SDH设备,支路板没有接收到输入信号,即检测到2M接口盒上传来的信号电平在一段时间内没有变化。
LOS只与本网元有关,一般是以下原因:
接口电缆接错或接口盒接触不良。特殊情况下,如果2M支路板出现硬件故障也会造成上述两种告警的出现。
处理类似光口LOS。
2.OOF帧失步、LOF帧丢失、LOM复帧丢失
A1、A2有固定的值,也就是有固定的比特图案。A1:11110110(f 6H),A2:00101000(28H)。收端检测信号流中的各个字节,当发现连续出现3N个f 6H,又紧跟着出现了N个26H字节时(在STM-1帧中A1和A2字节各有3个),就断定现在开始收到一个STM-N帧,收端通过定位每个STM-N帧的起点,来区分不同的STM-N帧,以达到分离不同帧的目的,当N=1时,区分的是STM-1帧。
当连续5帧以上(625us)收不到正确的A1、A2字节,即连续5帧以上无法判别帧头(区分出不同的帧),那么收端进入帧失步状态,产生帧失步告警--OOF;若OOF持续了3ms则进入帧丢失状态--设备产生帧丢失告警LOF,下插AIS信号,整个业务中断。在LOF状态下若收端连续1ms以上又处于定帧状态,那么设备回到正常状态。
3.LOP指针丢失
当导致指针值无法确知的条件连续出现规定的次数时,SDH设备应进入LOP状态。SONET标准明确规定[4],当连续8帧汉有找到有效指针,或者检测到8个连续NDF时设备应进入LOP状态。而当连续3帧检测到具有正常NDF的有效指针或级联指示时,设备应退出LOP状态。
一般伴随LOF、OOF产生,指针包括AU PTR以及TU PTR。
4.AIS、告警指示信号
(1)MS-AIS、AU-AIS、TU-AIS
复用段告警信号(MS-AIS):利用K2(b6-b8)开销字节
复用段告警信号指包含有效RSOH并且信号的其余部分为全"1"时的STM-N信号。
复用段远端缺陷指示(MS-RDI)字节:K2(b6-b8)
这是一个对告的信息,由收端(信宿)回送给发端(信源),表示收信端检测到来话故障或正收到复用段告警指示信号。也就是说当收端收信劣化,这时回送给发端MS-RDI告警信号,以使发端知道收端的状态。若收到的K2的b6-b8为110码,则此信号为对端对告的MS-RDI告警信号;若收到的K2的b6-b8为111,则此信号为本端收到MS-AIS信号,此时要向对端发MS-RDI信号,即在发往对端的信号帧STM-N的K2的b6-b8放入110比特图案。MS-AIS一般是伴随着远端LOS/LOF出现而出现的,或者从网管上插入该告警。
(2)处理方法:
(3)TU-AIS、TU-LOP。支路告警指示信号、支路指针丢失
造成TU-AIS的原因一般有:
5.B1性能记数及告警产生
(1)BIP8 再生段 比特间插奇偶校验
发送端对上一帧(1#STM-N)加扰后的所有字节进行BIP-8偶校验,将结果放在下一个待扰码帧(2#STM-N)中的B1字节;接收端将当前待解扰帧(1#STM-N)的所有比特进行BIP-8校验,所得的结果与下一帧(2#STM-N)解扰后的B1字节的值相异或比较,若这两个值不一致则异或有1出现,根据出现多少个1,则可监测出1#STM-N帧在传输中出现了多少个误码块。B1在所有网元将终结,包括REG、ADM、TM等。B1无远端概念。
(2)原因:光板接收光功率过强或过弱,系统本身所有。如光板收发光模块、时钟板及时钟质量。
(3)处理方法:将本端自环,适当调节光纤插入深度,若告警消失,则是由于光功率过强或过弱引起,过强加衰减,过弱将光纤洗干净,法兰盘连接处拧紧或换光发功率强的光模块,若不是光功率引起的,则是光板或时钟板所致,更换光板或时钟板则可。
6、B2:BIP-24
是发端B2字节对前一个待扰的STM-1帧中除了RSOH(RSOH在B1)及管理指针的全部比特进行BIP-24计算,结果放于本帧待扰STM-1帧的B2字节位置。其意义、产生原因以及处理方法与B1基本相同。
B2在对复用段开销处理的网元终结,同时发出对告信息。如REG不做B2的检验及对告,REG网元的B2字节将无任何改变发至下一个网元,由下一网元处理。其他包括ADM、TM均将B2终结,并且重新发起校验记数,而且有B2的对告消息回送至B2原来的网元。
7、B3
B3字节负责监测VC4在STM-N帧中传输的误码性能,监测机理与B1、B2相类似,只不过B3是对VC4帧进行BIP-8校验。
8、V5机制
V5字节的第1和第2比特的功能是进行通道的误码性能监视。V5字节的第3个比特是VC-12通道远端误码指示(REI)(原为远端块误码FEBE)。REI为接收到的各个监测块中的错误计数。V5字节的第5至第7比特提供VC-12信号标记功能。V5字节的第8比特是VC-12通道远端缺陷指示(RDI)(原为远端接收失效FERF)。RDI是向上游发送远端缺陷指示信号。当接收到TU-12通道AIS或者信号失效条件时,该比特设置为"1",否则就设为"0"。 V5误码产生原因及处理:复用段或再生段误码所致,及系统有B1或B2、B3误码时,此时先处理B1、B2、B3,如前面所述;支路板不良,处理支路板。
四、回到开始的问题
网管能从REG点检测到性能值只有B1性能,原因是REG只对再生段开销进行处理并终结,其它信号是透传的;
SDH测试仪在B点检测到的性能值有B2、B3、V5,原因是REG已经把RSOH终结,而其它信号是透传的;
SDH测试仪在C点检测到的性能值只有V5,原因是ADM已经终结了RSOH、MSOH和HPOH。如果ADM点是AU-4的交叉连接,那么SDH测试仪在C点还可以检测到B3。