你好,欢迎来到经管之家 [登录] [注册]

设为首页 | 经管之家首页 | 收藏本站

DWDM系统中的故障分析与定位_通信工程毕业论文范文

发布时间:2015-01-26 来源:人大经济论坛
DWDM系统中的故障分析与定位_通信工程毕业论文范文 DWDM系统中的故障分析与定位 摘要:本文从分析密集波分复用(DWDM)网络中常见故障的特点入手,对DWDM网络中影响业务的故障进行了分类,介绍了各类故障产生的原因。在此基础上,对网管上报的各种类型的告警在定位故障时所起的作用进行了排序,并且举例论证如何从系统中多个节点的多个告警中找出关键的告警,并把这些告警相互结合起来,准确定位故障。对于网管没有上报告警或者单纯依靠告警不能定位故障的情形,本文也做了详细地研究,分析了如何利用常用的仪表来准确高效地定位故障点。    由于互联网的发展,数据业务对带宽的需求在不断增加,持续推动着传输网络尤其是DWDM网络的建设和扩容。近年来,中国电信的波分复用(WDM)网络的容量一直在增加,多条波分干线实际配置的容量都已经达到了800Gb/s,DWDM系统的最小波道间隔也达到了50GHz,单波道容量甚至达到了40Gb/s[1]。在DWDM系统出现故障时,受到影响的业务量往往非常大。在这种形势下,保证波道的可用性,为业务提供有效的QoS保证,成为DWDM网络维护时必须考虑的首要问题。在DWDM网络出现故障时,必须尽快定位故障,以确保故障能够得到及时解决。  本文从分析DWDM系统中各种器件可能引发的故障以及各种故障产生的原理入手,提出了一种把网管告警和仪表监测结合起来的障定位方法。本文主要分为五个部分,第一部分简单介绍了传输系统的故障管理,指出了故障定位的重要性和难度;第二部分分析了DWDM系统中可能发生的故障,并对这些故障的形成原因进行分类说明;第三部分介绍了WDM系统中所使用的关键器件,以及这些器件可能引发的故障;第四部分介绍了DWDM系统维护中使用的主要仪表和监测方法,并对各种监测方法做了一个简单的比较;第五部分在前面分析的基础上,分析了如何把网管告警和仪表监测结合起来,高效快捷地定位故障。 1.故障定位的重要性和难度  故障管理作为网络管理的一个非常重要的组成部分,主要包括以下几个模块[2][3][4]: 故障监测:判断网络中是否存在故障; 故障定位:判断导致故障产生的原因和故障所在位置; 业务恢复:采用其他的路由迂回,借助纤芯调度或者波导调度恢复业务; 故障修复:修复或更换发生故障的光纤、器件或者单板。  在出现故障时,首先要恢复业务。在DWDM网络出现故障时,为了有效的利用备用资源,应该先定位发生故障的段落或具体的位置,然后再在此之间调度业务[5]。因此,故障的定位往往是恢复业务的前提。从这个意义上讲,故障定位是故障管理的一个关键环节。  日常维护中,故障定位会受到以下几个因素的影响:1、网络层次复杂,但是却缺少管理不同层(WDM、SDH、ATM、IP)间关系的物理手段。DWDM作为底层的传输通道,在出现故障时,很可能会影响业务。同样,业务层的故障也可能会导致DWDM网络出现告警。在业务出现告警时,我们往往很难定位到底是网络中哪个层面的故障影响了业务。2、单一的故障往往会引发网络中的多个节点出现多种告警,其中有些告警可能会混淆我们的判断,对故障定位造成不利的影响。3、由于波分设备中所使用的光监控器件的灵敏度和响应速度不够或者设备本身存在缺陷,在系统性能下降时,网管不能及时上报告警,甚至在某些情况下,网管会上报假告警。在故障定位时,应该克服这些不利因素的影响,准确定位故障。 2. DWDM系统中的故障分析  DWDM系统中常见的影响业务的故障大致可以分为三种:第一种是光缆中断。对于这种故障,我们通过网管可以定位出光缆断点所在段落,再用OTDR监测就可以精确定位断点。第二种是设备故障。例如光放盘故障可能会导致系统中断,分波合波单元的故障可能会造成一个波带甚至整个系统的中断,波长转换单元盘的故障往往影响一个波道。正常情况下,出现这些故障时,网管一般都会上报相关盘的告警,借助网管,就可以准确定位故障。DWDM系统中,比较常见但是却又相对难定位的故障就是网管没有上报或者没有及时、准确地上报告警,但是波道性能已经劣化的故障。从理论上讲,导致波道性能劣化的因素主要有以下几点: 光器件的插损、尾纤的衰耗以及线路的衰耗等原因造成光功率降低; 光纤的非线形效应,例如交叉相位调制(XPM)、自相位调制(SPM)以及四波混频(FWM)等引起的噪声[6]; 光纤的色散没有得到合理地补偿; 掺饵光纤放大器(EDFA)的自发辐射(ASE)噪声; 光发射机激光器波长的漂移; 光器件引入的串绕噪声。  在工程设计时,通常都会考虑到这些因素的影响,但是在系统使用一段时间后,器件的老化、光纤的多次熔接等因素都会导致系统的性能下降。 3. DWDM系统中的关键光器件及其对误码性能的影响  DWDM系统中的器件可以分成两大类:处理业务信号的光器件和监控器件。尽管,监控器件实现了DWDM系统性能监控和告警上报等功能,但是监控器件只是从信号光中分离出了很小一部分的光,它对信号的影响可以忽略不计,在监控器件出现故障时,业务不会受到影响。因此,DWDM系统中的故障大多是由处理业务信号的光器件造成的。不同的光器件由于在系统中所处的位置和所起的作用不同,对系统性能的影响也不同。 3.1 光发射机  DWDM系统中的光发射机通常采用的是集成式外调制激光器,因此,对光发射机而言,激光器的波长稳定性是一个十分关键的参数。在激光器中采用温控电路,使用良好的封装,可以有效地解决短期波长稳定性的问题,但对于激光器老化等原因引起的波长长期变化就显得无能为力了。波长漂移会使波道出现大误码,甚至完全不可用。 3.2 光纤  光信号在光纤中传输时,由于材料的吸收、弯曲损耗或者散射等原因会逐渐衰减。同时,光纤的非线性效应会引入噪声,使得信号的信噪比降低。此外,光纤的色散效应也会使信号的质量下降。机房中的尾纤由于插拔等原因造成接头不清洁或者损坏,都有可能增加信号的衰减,导致信号的误码率增大。 3.3 光接收机  光接收机的主要作用是把含有业务信息的光信号转换成电信号。光接收机对接收到的信号的光功率和信噪比都很敏感,如果超出了它可以接受的范围,就会出现误码。 3.4 波长转换器  在开放式DWDM系统中,最常用的器件是波长转换器,波分系统中使用的波长转换器实际就是一个收发一体的光收发机。他对接收到的信号的光功率和信噪比以及自身发出的光信号的波长都有较高的要求。 3.5 光放大器  在DWDM系统中使用的光放大器有两种:EDFA和拉曼(Raman)放大器,其中,应用相对较多的是EDFA。EDFA在C波段具有良好的放大性能,但是,EDFA在放大信号光光功率的同时,会引入自发辐射(ASE)噪声,降低了输入信号的信噪比。Raman放大器大多用在超长距离传输系统中,它的增益谱宽比EDFA更宽,同时噪声系数(NF)也比EDFA低。在Raman放大器中,主要的噪声来源有瑞利散射噪声和ASE噪声。 3.6 分波和合波器  分波和合波器是复用器和解复用器中非常重要的光器件,它的插入损耗以及不同波道间的串绕是影响其性能的关键参数。低的插入损耗能够确保系统的总衰耗保持在可用范围之内。串绕会引入噪声,导致信号的信噪比降低。 3.7 滤波器  滤波器可以在复用器和解复用器中应用,也可以应用在光放大器中以增强光放大器的增益平坦度,同时滤除噪声对各个波道的影响。滤波器对温度比较敏感,在温度超出额定范围时,会产生串绕,引入噪声。 4.DWDM系统中常用的性能监测仪表或监测方法 4.1 光功率计  光功率计可以测量一定波长范围内各个波道的光功率。但是,光功率受灵敏度和响应速度的影响,对于波道光功率逐渐缓慢变化的情形,不能及时做出反应,往往这时,波道已经产生大误码了。此外,光功率计不能衡量噪声对系统性能的影响,波道的光功率正常,并不一定表示系统性能正常。 4.2光谱分析  光谱分析仪(OSA)可以测量光信号的频谱,也可以测量各个信道的光功率、中心波长和信道的OSNR值。与光功率计不同,OSA不仅能测量波道的光功率,还能测量波道信噪比的变化。OSA的缺点是响应时间比较长,在测量时,还有可能会引入采样误差。 4.3 眼图监测  眼图监测可以直观衡量码间干扰和噪声的影响。如果没有码间干扰和噪声,则眼图清晰,眼图张开度大;当存在码间干扰时,眼图的张开度就会减小。分析眼图,可以得出信号的信噪比和Q值,进而得出波道的误码率[7]。但是眼图监测是一个统计的过程,并不能对波道中持续时间不长的故障做出分析。 4.4 多波长计  多波长计可以准确测量DWDM系统各个波道的波长。通常多波长计测量波长的精度比光功率计和光谱仪都高。对于由于激光器老化而造成的波长漂移,可以使用多波长计来准确测量。 4.5 回应声(Pilot tones)  回应声是一路与信号光同时传送的光信号,用来监测传输过程中,业务光有可能受到的损伤。回应声一般不能监测串绕的影响,只有在回应声信号受到串绕的干扰时,才能对串绕做出一定地评估。 4.6 OTDR  OTDR通过分析探测信号发送端收到的回声信号来准确定位造成系统中断的光纤弯折或中断的故障点。 4.7 误码监测:  误码仪可以直接测量波道的误码率,衡量波道的QoS。误码仪测量误码时的采样周期比较长,往往需要24小时以上。此外,误码仪的价格昂贵,不一定能保证各个机房都有误码仪。  DWDM系统中的监测方法主要有以上几种。图1对各种方法的有效性、复杂程度、所花费时间以及成本高低等特点做了一个简单的比较。在实际监测或者定位故障时,应该因地制宜,采用合理并且高效的方法。 图1. 各种测量方法的特点比较 5. DWDM系统中故障定位的主要方法和手段 5.1 借助告警定位故障  在系统出现故障时,网管一般都会上报告警,因此,通过告警来定位故障是最直接的办法。在故障发生时,通常会在多个相邻的节点产生多种告警,但是并不是所有这些告警信息都对故障定位有帮助,仅仅其中部分关键的告警信息对于故障定位是必须的。设备故障告警的告警源是发生故障的设备,通过查询告警源就能直接定位故障。光监控通道(OSC)作为传递监控信息的通道,它的速率通常只有2.048Mb/s,远小于系统中业务波道的速率,因此,OSC信号对噪声最不敏感,对应的接收机的灵敏度也更高。当OSC通道发生故障时,如果OSC盘没有上报告警,就表明系统性能劣化了,系统中业务波道的性能也会下降,因此,OSC通道的告警所包含的信息量应该比波道告警所包含的信息量大。此外,我们不难分析出合路信号的告警比单个波道的告警在定位故障时所起的作用更大。由以上的分析,按照告警信息的关键程度,可以给各种告警在定位故障时的重要性排一个序:  设备故障告警﹥OSC通道告警≧合路信号告警﹥单个波道告警  以业务全阻为例,如图2所示,当节点B-C间所有的业务中断时,可能的原因有两个,一是节点B和C之间的光缆中断,二是节点B和C的功率放大器、前置放大器或者解复用器等设备出现故障。在这种情况下,应该首先判断是不是设备的故障。如果是设备故障,通过网管上报的告警就可以准确地定位故障。如果网管没有上报设备故障的告警,可以观察同缆中其他系统的运行情况来判断光缆是否中断。如果光缆中所有的系统都中断,我们就可以断定光缆中断了。  对于光缆中断的情形,应该做一个详细的分析。当光缆在节点B和C之间中断时,与断点相邻的两个节点B和C都会出现合路信号丢失告警、OSC信号丢失的告警以及单波道信号丢失的告警。如果业务在节点C直通到节点D,C点收到OSC信号丢失的告警时,C往D方向发送的光功率将会大大降低。光信号在C点到D点传输过程中,由于光纤的衰减,D点收到的光信号可能会很弱,这样D点也有可能会报合波信号丢失的告警。在这种情形下,如果我们单纯关注合路信号丢失的告警,就很难判断出光缆断点是在B和C之间还是在C和D之间。但是,应该看到,在光缆中断时,节点B和C都会报OSC信号丢失的告警,C向D发送的业务信号光功率虽然降低了,但是发送的监控通道的光功率并没有下降,因此,节点D不会上报OSC信号丢失的告警。在这种情况下,如果把OSC通道的告警和合路信号的告警结合起来,就可以准确判断出光缆中断的段落在节点B和C之间。    图2. DWDM系统业务全阻故障示意图  从上面的例子我们可以看到,各种告警在定位故障时所起的作用是不同的。在定位故障时,应该从相对重要的告警信息入手,排除其他次要或者无用信息的干扰。当然,我们也不能只依靠那些相对重要的告警信息,而是应该把各种告警信息关联起来考虑,找出各种信息之间的内在联系,才能有效的定位故障。此外,也应该注意各种告警对于故障定位的重要性并不是千篇一律的,应该针对具体情况做出具体的分析。 5.2 借助性能监测来定位故障  对于波道性能劣化的故障,网管可能会在某个单元盘上给出相关的提示。通常这个提示只是有一定的参考作用,并不能准确指出性能劣化的根源所在,因为,很有可能在此单元盘之前,波道的性能就已经下降了。在这种情形下,应该根据本文第二、三小节所作的分析,判断可能发生故障的器件,然后逆着信号传输的方向,找到造成波道性能劣化的故障点。  对于业务已经受到影响,但是网管却没有上报告警,或者没有上报有效的告警的情况,在处理的时候,通常需要分段环回,借助网管或者误码仪的监测来逐步缩小故障点所在的范围。然后,测量故障点或故障段落的相关参数的性能,定位故障。图1对测量各种性能参数数所花费的时间和成本、操作的难易程度以及定位故障的有效性等方面做了一个简单的比较。由图1的分析,我们可以看到,对于这类性能下降的故障,通常测量光功率是最容易实现的,但是,如果光功率在正常范围之内,就需要进一步测量光信噪比、眼图或者误码率。  从上面的分析,我们可以看到,如果单纯依靠网管不能定位故障,为了以最快的速度和最高的效率定位故障,恢复业务。应该首先通过逐段环回找到故障点或故障段落,然后使用图2中方框内所给出的测量方法来定位故障点。在实际处理故障时,我们应该根据实际需要,把网管和仪表结合起来,采用简单快捷的方法定位故障。 6.结论  故障定位是故障管理的一个重要环节,它是故障修复和业务恢复的基础和前提。在定位DWDM系统的故障时,应该分析各种故障自身的特点,把不同节点、不同类型的告警结合起来,找出其中的关键信息,准确定位故障。对于单纯依靠网管上报的告警不能定位的故障,或者网管没有上报告警的故障,应该借助合适的仪表,测量相关的性能参数,找出故障点。 参考文献 华信邮电咨询设计研究院有限公司, 国家高技术研究发展计划(863计划)课题“可扩展到80×40G 3Tnet长途试验系统的设计、建设、测试与试运行”项目一阶段设计,2005.9 Laxman Sahasrabuddhe, S. Ramamurthy, and Biswanath Mukherjee, “Fault Management in IP-Over-WDM Networks: WDM Protection Versus IP Restoration”, IEEE J. Select. Areas Commun., vol. 20, Jan. 2002, pp. 21-34. J. S. Baras, M. Ball, S. Gupta, P. Viswanathan and P. Shah, “Automated Network Fault Management”, MILCOM'97, Monterey, CA, November 2-5, 1997. Carmen Mas , Patrick Thiran, “An efficient algorithmfor locating soft and hard failures in WDM networks ”, IEEE J. Select. Areas Commun., vol. 18, Dec. 2000, pp. 1900-1911. 中国电信集团公司网运部,长途波分系统维护波道管理要求(暂行),2005.8 Shake I., Takara H., Kawanishi S., “Simple Q factor monitoring for BER estimation using opened eye diagrams captured by high-speed asynchronous electro-optical sampling”, IEEE Photon. Technol. Lett., vol. 15, Apr. 2003, pp. 620-622. Zhao Yongpeng, Ye Peida, “Influence of XPM effect on IP traffic-based WDM optical packet-switching networks”, Microwave & Photon. Technol., vol. 32, Feb. 2002, pp. 170-174.
经管之家“学道会”小程序
  • 扫码加入“考研学习笔记群”
推荐阅读
经济学相关文章
标签云
经管之家精彩文章推荐