1. 引言
随着光传输技术的发展以及IP数据业务量的飞速增长,人们需要一个新的网络架构来承载大量的业务。随之应运而生的多层光网络将成为下一代网络的核心,多层光网络由IP层和光层两层组成,两张网络各司其职,IP层负责数据分组和转发,下面的光层则负责大容量长距的数据传送,为IP层提供光通道(如图1),多层网络在实际中的应用能够大大降低运营商的资本投入。
对于承载了巨大数据业务量的骨干网来说,一旦网络发生故障会对整个社会产生严重影响。因此,在通信日益发展的今天,网络的生存性技术作为保证网络正常运营的手段,就显得尤为重要。一个完整的生存性策略应包括下面几个部分:故障的发现、定位、声明和解除,本文中,我们重点讨论故障的解除,即恢复机制。在目前的多层网络架构中,传统的恢复方法是针对IP层和光层分别部署恢复机制,

Figure 1. Multi-layer optical network basic architecture
图1. 多层光网络基本架构
且两层的恢复机制间没有信息交流,每条IP链路设计为不超过50%的峰值负载链路利用率,以便在出现故障时,有足够的容量可以从故障中恢复,本文将这种传统的针对多层网络的恢复机制称为双平面保护。这种传统的保护机制在现阶段面临两个重要的问题:首先,大量的闲置路由器增加了网络架构的成本;其次,无层间交流的恢复机制在网络故障时如何协调工作也是难点所在。基于这些问题,本文提出了一种新的恢复机制,使用多层共享备用路由器(MLSBR)来实现网络故障的恢复。
MLSBR方法的关键是使用额外的多层共享备用路由器,取代双平面保护中大量的闲置路由器,在出现网络故障时,可以重新计算路径将流量引入备用路由器从而恢复中断的网络,这和传统的恢复机制对比,可以极大降低运营商架构网络时的成本。
本文的结构如下:第二节简要介绍了现阶段部署的传统的双平面保护方法;第三节介绍了MLSBR方法,并结合了案例对它进行分析;接下来,第四节分析了两种恢复机制的可用性;之后,第五节对实际部署共享备用路由提出一些需要解决的问题;最后在第六节总结全文并指明了未来的发展方向。
2. 相关工作
对于多层网络恢复机制来说,已经有很多相关研究, [1] 中的作者提出基于线性规划大规模网络故障恢复机制, [2] [3] 中的作者具体设计了IP/WDM网络架构的实现, [4] 中的作者对多层网络的生存性进行研究,而 [5] 中的作者针对IP/WDM网络进行生存性的探讨。现阶段骨干网的网络拓扑结构是由IP路由器和可重构的光分插复用器(ROADM)组成,IP节点连接到光节点通过光拓扑来传输数据。对于这种多层网络架构,恢复机制是人们较为关心的问题之一, [6] 中的作者定义了如何从故障中恢复的新指标, [7] 中的作者提出软件定义光网络中的链路故障恢复机制, [8] 中的作者提出基于BFD的MPLS网络自愈恢复技术。
针对当前的这种多层网络架构,传统的恢复机制是将业务量需求进行等效分割,分为等效的两个平面,每个平面承载50%的流量,而各个平面可承载的最大流量为100%,因此一个平面出现故障时,该平面承载的流量可以引入另一平面,保证网络能从故障中恢复(如图2)。对于传统恢复机制的改进,也已有相关研究, [9] 中作者提出了一种更具成本效益的架构作为当前双平面保护的替代方案,而 [10] 中的作者提出了备用路由的概念,且 [11] 在 [10] 的基础上对这种方法进行了经济上的分析。
对于这种传统恢复机制来说,其引入另一平面的过程由快速重路由(FRR)实现,可以控制在50 ms内,由于它较短的平均故障恢复前时间(MTTR),会增加运营商的资本投入。而同时两个承载平面的设计也会大大增加闲置路由器的数量,这也是导致成本增加的重要因素之一,此外,网络故障时,无层间交流的恢复机制如何协调工作也是需要解决的问题, [12] 中的作者讨论了如何协调多层网络不同层并给出了评估结果。
3. 共享备用路由以及案例分析
共享备用路由方法需要建立额外的路由器,这些备用路由器在出现故障时投入使用。我们为IP层假定一种三层的分层的体系,由底层至高层分别是接入路由器、传输路由器和互连路由器(如图3)。
对于双平面保护来说,需要双倍的传输路由器和互联路由器,而当使用共享备用路由方法时,则可以省去复制的闲置路由器,仅仅加入一些共享备用路由器,传输路由器出现故障时,备用路由器复制故障路由器的配置,例如复制故障路由的路由表等,为接入路由器和互连路由器建立新的连接,从而让网络从故障中恢复(如图4)。共享备用路由方法的具体工作过程如下:
1) 发生故障。
2) 丢失连接的IP/MPLS节点向周围发送请求建立新的连入网络的路径。此时有两种情况。
a) 本地区域备用路由器可用时,通过请求备用路由器重新建立路径。
b) 本地区域备用路由器不可用时,通过请求连入临近区域的备用路由器重新建立路径。
3) 本地区域备用路由或邻近区域备用路由收到请求,检查自身工作状态,并发送相应的反馈信息。
4) IP/MPLS节点接收备用路由器的反馈信息选择建立新路径或是请求其他备用路由器。如果需要请求其他备用路由器,则返回第二步继续循环。反之,完成备用路径的建立。
5) 故障路由器修复后,释放建立的备用路径,将流量重新引入工作路径。

Figure 4. Share backup route recovery mechanism
图4. 共享备用路由恢复机制
我们可以发现使用传统的双平面保护时,恢复用时要少于共享备用路由机制,因为在故障发生时,共享备用路由机制需要为备用路由器重新设置光连接,在重新设置连接时配置路由器需要一定时间,而双平面保护使用FRR方法可以将恢复时间控制在50 ms内,正是由于共享备用路由机制较长的MTTR,也代表相对于传统恢复机制来说它可以减少运营商的资本投入。用备用路由器替代双平面保护中大量闲置的路由器也大大降低了网络架构的成本。
图5为一个简单的IP层拓扑结构,由10个IP路由器组成,其中TR1-TR4为互连路由器,TR5-TR10为传输路由器。如果采取双平面保护,则其传输路由器的数量增加一倍达到12个。如果采取共享备用路由方法,因为考虑到IP层的容量应为最大占用的80%,所以在有6个传输路由器的情况下,最少应使用2个备用路由器,当使用6个备用路由器时,情况类似于双平面保护,因此共享备用路由方法中使用的备用路由器数量在2~6之间,具体应依据该网络架构需要保护的节点数量来决定。
使用2个备用路由器时,传输路由器的数量由12个减少到8个,其中6个是工作路由器2个是备用路由器,这种情况能够获得最大程度的节约成本,可以达到33.3%,图6展示了使用不同数量的备用路由器时可以获得的减省。
4. 可用性对比
本节中我们基于两种情况(单区域和双区域)分析双平面保护和共享备用路由方法各自的可用性。网络可用性(Availability)在这里用Ava表示,设备可用性用EAva表示,其中,我们用停机时间比运行时间得到总不可用性从而推出总可用性如公式1,设备的可用性由平均失效前时间和平均故障间隔时间表示,

Figure 6. The number of backup routers and the amount of reduction
图6. 备用路由器数量和减省量
如公式2:
总可用性
(1)
设备可用性
(2)
易推出
设备不可用性
(3)
这里我们用
代表
,公式(3)可以表示为
(4)
则网络可用性可以用设备可用性计算出来。
4.1. 单区域
在只有一个区域时,双平面保护和共享备用路由方法都在两个路由器同时不可用时网络才会中断,所以可以等效看待。此时可以用设备可用性来表达网络可用性,此时网络不可用性为两个路由器同时不可用的概率,即两个路由器不可用性的乘积,易得出
(5)
图7表示了单区域时双平面保护和MLSBR方法可用性和λ之间的关系,由图可见,在单区域时两种方法的网络可用性表现相同,且网络可用性都会随着
值的增加而降低。
4.2. 双区域
有两个区域时,双平面保护的可用性依然和单区域时相同,因为对于双平面保护来说两个区域之间没有信息交流,所以其可用性依然如下表示
(6)
而对于MLSBR方法来说,只有3个路由器或4个路由器同时出现故障时网络才会中断。4个路由同时故障的概率是4个路由不可用性的乘积,而3个路由不可用的概率为3个路由不可用性的乘积再乘上一个路由可用性,易得出此时MLSBR方法的网络可用性为
(7)
图8表示了双区域时双平面方法和MLSBR在可用性方面的对比,可以看出随着l值的增加,采用这两种不同的恢复策略都难以避免网络可用性的增加,但是在
之后,在相同l值时,MLSBR的可用性要优于传统的双平面方法。

Figure 7. The availability of both methods in a single region
图7. 单区域两种方法的可用性

Figure 8. The availability of two methods in double regions
图8. 双区域两种方法的可用性
5. 结束语
本文在分析了针对多层网络的传统恢复机制的基础上,提出了MLSBR方法,与现阶段双平面保护相比,这种机制不仅节省网络架构的成本,降低运营商资本投入,在可用性方面也优于传统恢复机制,但是,在实际部署MLSBR时,仍面临一些困难,例如信令格式的选择和如何统一控制等,我们需要在未来的研究中解决这些问题。