IRF之分布式弹性路由( 五 )



为了解决这些难题,华为3Com推出了一系列极具创新性的技术 。
第一,;;;;;推出了设备间配置恢复技术:当Fabric探测到有新Unit加入时,立即启动设备间配置恢复流程,使得在新Unit加入之前的Fabric上的所有配置都被成功恢复到新Unit上,从而使得新Unit在极短的时间内做到与Fabric上所有其它Unit配置信息的一致性 。
第二,;;;;;推出了设备间的三层接口恢复技术:当Fabric探测到有新Unit加入时,立即启动设备间的三层接口恢复流程,使得在新Unit加入之前的Fabric上的所有三层接口都被成功恢复到新Unit上,从而使得新Unit能够与其它Unit一样拥有整个Fabric上的所有三层接口 。
第三,;;;;;推出了设备间路由协议批量备份技术:当Fabric探测到有新Unit加入时,立即启动设备间路由协议批量备份流程,Fabric会将正在运行的各个路由协议的所有路由信息批量备份给新Unit,包括路由协议的各种协议状态机、接口状态机以及链路信息库等,以OSPF为例,就需要备份OSPF全局数据、所有区域的相关数据、所有接口的状态机及相关数据、所有邻居的状态机及相关数据、所有LSA以及重传列表等 。通过设备间的路由协议批量备份使得新Unit在短时间内迅速与Fabric上所有其它Unit上的路由信息保持完全一致,从而为Fabric在后续长期运行中各个Unit上路由信息保持完全一致奠定坚实基础 。
Unit离开的处理
同样,为了让IRF设备的故障智能保护成为可能,就需要使Fabric能够自动探测各个Unit上故障的发生,并作出及时处理,使得一个或几个Unit的故障不会中断或影响Fabric上路由协议和网络业务的正常运行 。
由于不管是Fabric内部线路故障或者Unit本身发生故障,都表现为某个或者某些Unit不能正常工作,Fabric通过内部探测协议可以发现这些不能正常工作的Unit,并把这些Unit从Fabric中剔除出去,所以对于Fabric中的其它正常Unit来说,它们感觉到的是某个或者某些Unit离开了Fabric,因此这种故障智能保护的处理归根结蒂也就是对Unit离开事件的处理 。
当Fabric探测到某个或者某几个Unit离开时,立即通知给其它Unit,由于Fabric中各个Unit上的路由信息是完全一致的,因此剩下的Unit可以无缝的接管离开的Unit的工作 。对于整个Fabric来说,所有路由协议信息都没有改变,例如OSPF的接口状态机以及邻居状态机都没有改变,因此不需要与外界设备进行重新协商;OSPF的所有链路信息库也是完整的,因此也不会出现丢失路由现象 。因此,在不能正常工作的故障Unit离开Fabric的时候,路由协议不会随之出现中断,二/三层转发流量和业务也都不会出现中断,从而真正意义上实现了设备故障的智能保护 。
以图7为例,Unit1发生故障后,Unit2可以无缝的接手Unit1的工作,Fabric上所有正在运行的路由协议OSPF/RIP都不会受到影响,对于外界设备来说,根本感觉不到Fabric上有故障发生 。
图7 Fabric故障保护示意图
统一的三层转发表
上文在“IRF之分布式弹性路由的技术特点和应用价值”一节中提到IRF设备还有一个非常重要的特性,那就是实现三层报文的分布式转发,即实现了“IRF之分布式弹性路由”技术后,Fabric上任意一个Unit都有完整的三层转发能力,当它收到待转发的三层报文时,可以通过查询本Unit的三层转发表得到报文的出接口以及下一跳,然后将报文从正确的出接口送出去,这个出接口可以在本Unit上也可以在其它Unit上,并且将报文从一个Unit送到另外一个Unit是一个纯内部实现,对外界是完全屏蔽的,即对于三层报文来说,不管它在Fabric内部穿过了多少Unit,在跳数上只增加1,即表现为只经过了一个网络设备 。

推荐阅读