关于NSR和NSF

  1. 关于NSR和NSF
    1. (1)NSR和NSF简介
    2. (2)NSR原理
    3. (3)NSR配置
    4. (4)应用场景:

关于NSR和NSF

不间断转发NSF(Non-Stopping Forwarding)和不间断路由NSR(Non-Stopping Routing)是高可靠性的两个解决方案。

(1)NSR和NSF简介

  • NSR(Non-Stop Routing):通过协议备份机制,实现主备倒换时控制平面(路由)和转发平面(业务)均不中断。
    • NSR的目的是防止或至少减轻对等会话中断的影响,其核心思想是路由协议平面的冗余同步,使路由器控制平面故障的情况下,能够迅速通过冗余进行恢复,并保证在此过程中邻居不感知本端故障。
    • 设备主用主控板故障(双主控板)、主备主控板倒换时,通过主备主控板的备份机制,控制平面和转发平面均不受影响,实现业务转发不中断;NSR不能实现协议重启过程中流量转发不中断。
    • 在设备发生倒换的过程中,路由处理不中断,因为:
      • 邻居和拓扑信息不丢失
      • 邻居关系不中断
    • 这种方式的优点有:
      • 不依赖也不影响对端设备,没有互通问题
      • 路由的收敛速度要比NSF快
  • NSF:通过协议的GR(Graceful Restart)机制,支持系统主备倒换时,转发业务不中断。
    • 当由于某种原因系统发生故障时,在系统重启过程中,转发平面(业务)不中断
    • 系统恢复后,设备能够重新建立邻居关系,从邻居处获取路由信息并重建路由表

正常情况下,当设备主控板发生主备倒换时,NSR模式不会产生丢包,而NSF模式会有少量的丢包

(2)NSR原理

相关概念:

  • HA(High Availability):高可靠性/高实用性的简称,这里指主备板间的备份通道。
  • NSF(Non-Stop Forwarding):不间断转发。
  • NSR(Non-Stop Routing):不间断路由,是一种在系统控制平面发生故障且存在备用控制平面的场景下邻居控制平面不感知的技术。
  • AMB(Active Main Board)和SMB(Slave Main Board):主用主控板和备用主控板,单板上承载控制平面进程。
  • LPU(Line Interface Process Unit):接口板,单板上承载转发控制进程。

NSR原理:

如图所示,NSR原理主要包括以下三个过程:

  • 批量备份:NSR功能使能后,备板复位重启时,主用主控板将路由信息和转发信息批量备份到备用主控板上。批量备份过程在实时备份过程之前进行,此时NSR无法实施主备倒换过程。

  • 实时备份:当批量备份过程结束后,系统进入实时备份阶段。任何在控制平面和转发平面的改变都将实时从主用主控板备份到备用主控板上。在该阶段,备用主控板能够随时代替主用主控板工作。

  • 主备倒换:在已经完成备份的NSR系统主用主控板发生故障时,备用主控板会通过硬件状态感知到主用主控板故障,并成为新的主用主控板。备用主控板升主后,该单板会切换接口板的报文上送通道。由于倒换时间足够短,路由协议在主备切换的过程中不会和邻居节点断连。

(3)NSR配置

NSR对系统可靠性要求很高。要求当系统控制平面发生故障后,不依赖于邻居就能将控制平面平滑切换到备用平面,路由不间断。

在以下情况下,使用系统级NSR功能:

  • 系统故障触发主备倒换
  • 软件升级或系统维护时网络管理员手动触发主备倒换

使用NSR特性有如下限制:

  • 系统倒换后的平滑时间不是关键的性能指标。NSR不会针对系统倒换后的平滑时间进行优化设计,全部采用全平滑的方式。
  • 由于采用备份稳态邻居的方案,可能会导致对端设备认为已经建立的邻居关系在倒换过后重新建立。这种情况下邻居设备会感知倒换的发生。对于这种临界情况下倒换瞬间建立的邻居关系,还没有更新报文发生,邻居重新建立不会导致业务发生任何中断。
  • 对于单主控的系统,不能使用NSR实现高可靠性。
  • 如果在批量备份之前主用进程发生故障,备用进程的状态是不可预知的,没有进入可以倒换的状态,不能够承担主用进程的角色,此时使用NSF技术。
  • 使能了NSR的系统不支持系统级GR、ISSU。

在主备倒换端,系统支持NSR和GR两种不同的高可靠性保护,他们是互斥的。即,对于一个特定协议,系统倒换后,只能采用NSR或GR两种处理方式的一种。设备在部署NSR时,仍然可以支持GR Helper的功能,以支持自己的邻居GR过程,最大可能的保证用户全网网络节点业务的高可靠性。

(4)应用场景:

缺省情况下,系统HA的工作模式为不间断转发NSF(Non-Stopping Forwarding)模式。到了V8平台后,系统已全部为NSR模式,不再支持NSF模式。

当系统发生故障、软件升级或在系统维护时可能触发设备进行主备倒换。用户可以指定设备主备倒换时采用的系统HA工作模式为NSF功能或者NSR功能,确保主备板切换后,业务不受影响,从而保证设备的可靠性。

  • 当网络对丢包的要求、对路由收敛的速度的要求都比较低时,可以使用switchover mode nonstop-forwarding命令部署NSF功能。
  • 当网络对丢包的要求、对路由收敛的速度的要求都比较高时,可以使用switchover mode nonstop-routing命令部署NSR功能。

NSF与NSR模式切换后,系统会重启备用主控板,主用主控板重新向备用主控板备份数据,在此期间用户将不能执行其他配置操作。


转载请注明来源,欢迎对文章中的引用来源进行考证,欢迎指出任何有错误或不够清晰的表达。可以在下面评论区评论,也可以邮件至 xumeng32@126.com

文章标题:关于NSR和NSF

文章字数:1.6k

本文作者:F_numen

发布时间:2020-03-06, 23:12:13

最后更新:2020-03-21, 14:03:38

原始链接:https://netheroone.cn/archives/bcc1637b.html

版权声明: "署名-非商用-相同方式共享 4.0" 转载请保留原文链接及作者。

目录
/*baidu统计*/