深入解析 ETH OAM:以太网链路维护的核心协议
在以太网技术从局域网向广域网不断拓展的进程中,网络规模日益庞大,结构愈发复杂,运营商对于网络的可维护性提出了更高的要求。传统的网络维护手段在面对复杂的广域网环境时,逐渐显现出诸多不足,难以满足运营商对网络故障快速检测、定位和维护的需求。正是在这样的背景下,ETH OAM(Ethernet Operation, Administration and Maintenance)应运而生,它作为一种基于 MAC 层的协议,为以太网链路的维护提供了全新的解决方案。
ETH OAM 的基本概念与特性
ETH OAM 是一种专门针对以太网链路维护的协议,它的一个重要特点是与传输介质相互独立。这意味着无论以太网采用何种传输介质,如光纤、双绞线等,ETH OAM 都能在 MAC 层上正常工作,不会受到传输介质类型的限制。OAM 报文仅在 MAC 层进行处理,不会对 Ethernet 的其他层次,如物理层、网络层等产生影响,从而保证了以太网原有各层次功能的稳定性和独立性。
同时,ETH OAM 作为一种低速率协议,在运行过程中所占用的网络带宽非常小。通常情况下,这种带宽占用几乎不会对链路所承载的业务造成任何影响,确保了业务的正常传输。这一特性使得 ETH OAM 能够在不影响网络正常业务的前提下,实现对以太网链路的有效维护。
ETH OAM 的两大应用方向
ETH OAM 主要包括以太网业务 OAM 和以太网端口 OAM 两大应用方向,它们从不同的角度为以太网链路的维护提供支持。
以太网业务 OAM:端到端的链路维护
以太网业务 OAM 聚焦于端到端以太网链路的维护工作。它以业务为基础,以 “维护域” 为单位来实现端到端的检测。在实际应用中,它能够对网络中同一业务流流经的各个网络段进行分段管理,从而更加精准地把握整个业务链路的运行状态。
以太网端口 OAM:点到点的链路维护
以太网端口 OAM 则主要关注 EFM(Ethernet in the First Mile,以太网最后一公里)中两台直连设备之间的点到点以太网链路维护。与以太网业务 OAM 不同,它的应用不针对具体的业务,而是通过 OAM 自动发现、链路性能监控、故障检测、远端环回、自环检测等功能,来完成以太网点到点链路的维护工作。
以太网业务 OAM 的核心组成部分
维护点(MP):OAM 的功能实体
维护点(MP,Maintenance Point)是以太网业务 OAM 的核心功能实体。每个维护点都拥有一个唯一的维护点标识,即 MPID(Maintenance Point Identification),在同一维护联盟(MA)内,该 ID 是唯一的。各维护点的信息通过 MAC 地址表、维护点表和路由表来进行记录。其中,业务类型、业务 ID、VLAN 标签是 MP 配置信息中的关键内容。
维护点主要分为 MEP 和 MIP 两种类型:
- 维护联盟边缘节点(MEP):MEP(Maintenance association End Point)定义了 MA 的起始位置,它是 OAM 报文的发起和终结点,与业务紧密相关。
- 维护联盟内部节点(MIP):MIP(Maintenance association Intermediate Point)不能发起 OAM 报文,但它可以响应和转发 LB 报文和 LT 报文,不过只能转发 CC 报文。
维护域(MD):OAM 的网络范围
MD(Maintenance Domain)指的是需要进行 OAM 的一个网络。在实际的网络环境中,客户、服务提供商、运营商所关注的网络段往往存在差异,因此需要以网络段作为管理单位,来实现对网络中同一业务流流经的各个网络段进行分段管理,同时也能对不同业务流进行区分管理。
从 OAM 的角度来看,“维护域” 可以理解为一个服务实例上的所有 MP 的集合,这些 MP 包括 MEP 和 MIP。在需要维护的管理段两端分别建立 MEP,以此来设定维护域的范围,其他位置则根据实际需要建立 MIP。通过对这些维护点的操作,以及 MP 之间的联系和应答结果,就能够掌握整个管理段的状态,实现故障的检测与定位。
维护联盟(MA):与业务相关的域
MA(Maintenance Association)可以看作是一个与业务相关的域,它由若干 MEP 和 MIP 组成。在运营商的网络中,通常一个 VLAN 对应一个业务实例,而在设备上,一个或多个 MA 可以对应一个 VLAN。通过划分 MA,能够实现对传输某个业务实例的网络的连通性故障检测。
需要注意的是,MA 是 MD 的一部分,一个 MD 可以划分成一个或多个 MA,并且 MA 的级别等于它所在的 MD 的级别。此外,MEP 只能响应同一个 MA 中其他 MEP 发起的 OAM 操作,因此需要将发起 OAM 操作的 MEP 设置为远端维护点,以确保发起和响应 OAM 操作的两个 MEP 属于同一个 MA。
以太网业务 OAM 的分层管理机制
以太网业务 OAM 通过在 OAM 协议报文中加入管理级别(Level)字段,实现了分层管理。高层管理域可以跨越低层管理域,而低层管理域无法跨越高层管理域。这种分层管理机制具有重要的意义,它不仅能够实现同一业务流的分段维护,还能实现不同业务流的管理。
目前,协议支持 0~7 共 8 个层次级别的划分,“0” 层次管理域级别为最低,“1~7” 级别依次递增。这 8 个 MD 等级用于区分用户、供应商和运营商,具体如下:
- 用户 MD 等级:7、6、5
- 供应商 MD 等级:4、3
- 运营商 MD 等级:2、1、0
层级级别由高到低依次为:用户 MD 等级 > 供应商 MD 等级 > 运营商 MD 等级。
在实际应用中,处于不同层次的维护点对 OAM 协议报文的处理方法有所不同:
- 对于高于本层次级别的 OAM 协议报文,各维护点做透传处理。
- 对于低于本层次级别的 OAM 协议报文,各维护点直接丢弃。
- 对于和本层次级别相同的 OAM 协议报文,根据 OAM 协议报文的消息类型,各维护点响应或终结。
以太网业务 OAM 的主要操作
以太网单板支持 CC、LB、LT 等多种以太网业务 OAM 操作,这些操作在不同的场景下发挥着重要的作用。
CC(Continuity Check):连通性检测
CC 通过 MEP 之间周期性互发 CCM(Continuity Check Message,连续监测报文)来检测各 MEP 之间的连通性,这种检测被称为连通性检测或 CC。需要注意的是,只有 MEP 能够启动和响应连通性检测。它主要用于实时检测链路的单向连通性,但使用 CC 不能精确地检测出网络中哪段链路出现了故障,需要通过 LT 功能进一步定位。
LB(Loopback):环回测试
LB 可以实现由源端 MEP 到维护域内任一 MP 链路状态的检测。同样,只有 MEP 能够发起 LB 测试以及作为测试的终结点。LB 主要用于实时检测双向连通性,和 CC 相比,LB 实现的是一次性检测,每次检测都需要人工下发命令,并且使用 LB 不能一次性检测出网络中哪段链路出现了故障。
LT(Link Trace):链路追踪
LT 在环回测试的基础上进一步强化了故障定位的能力,能够实现一次定位故障网络段。只有 MEP 能够发起 LT 测试以及作为测试的终结点。LT 主要用于现场定位问题和定位故障点,和 LB 相比,LT 测试的链路上所有的 MP 都会响应 LTM 消息帧,根据这些响应消息可以判断出源 MEP 到目的 MEP 所经过的所有 MIP。
AIS(Alarm Indication Signal):告警指示信号
AIS 在以太网 OAM 中用于向上层报告错误。激活了 AIS 的维护点在检测到故障后,将向上层维护点发送 AIS 报文,以通知维护点故障;禁止 AIS 则不上报故障。通常,对于级别为 n 的维护点,屏蔽 AIS 信息的客户层级别应设置为 n+1。当链路中存在多个维护域嵌套时,通过激活 AIS 和设置屏蔽 AIS 的客户层级别,可实现故障维护点的准确定位。
LM(Loss Measurement):丢包统计
LM 功能就是设备用计数器统计一条链路 Ingress 端和 Egress 端的帧丢失数量。当链路产生故障的时候,LM 功能能够帮助运维人员有效对故障进行分析。丢包率就是未传递的业务帧数量除以时间间隔 T 内业务帧的总数,单位是百分比。LM 分为单端 LM 和双端 LM,单端 LM 是按需 OAM,即一次性丢包率统计;而双端 LM 是主动 OAM,即定期自动持续的丢包率统计,主要用于测试一条链路是否可用。
DM(Delay Measurement):时延统计
DM 功能用于测量一对 MEP 之间的时延,每个独立的 MEP 点都可以进行时延的测量。DM 包括单向 DM 和双向 DM,该方法利用环回进行帧时延的测量,帮助定位故障。
FDV(Frame Delay Variation):时延抖动
不同的帧可能时延不一样,时延抖动 FDV 就是根据一段时间内多次时延统计(DM)的测量结果计算而来。FDV 用于测量一条点到点的链路上、MEP 点之间,帧与帧之间的时延变化。
RDI(Remote Defect Indication):远端故障指示
RDI 以太网远端故障指示功能,用来向对端的 MEP 点指示本地接收到 CC 故障,主要用于单端差错管理和远端性能检测,反映远端是否出现过故障。
OAM Ping:在线测试
OAM_Ping 测试提供了一种在线测试方法,一定程度上可以模拟测试业务因误码导致的丢包率和时延时间。在检测连通性的基础上实现了对以太网 MAC 层的链路性能的精细化管理,主要用于实时检测本端设备与支持 ICMP 协议的数据通信设备间的业务性能,能够比连通性检测提供更详细、精确的 OAM 信息。
ETH OAM 的重要意义与应用前景
ETH OAM 的出现,为以太网链路的维护带来了革命性的变化。它解决了传统网络维护手段在广域网环境下的不足,实现了对以太网链路的高效、精准维护。与现有的端口环回功能相比,ETH OAM 能够有选择性地对某一业务流进行环回,而不是针对端口上所有报文进行环回。同时,它还能够发现硬件故障类的问题,并实现故障的自动检测和定位。
随着以太网技术的不断发展和广泛应用,ETH OAM 在运营商网络中的重要性日益凸显。它为运营商提供了强大的网络维护工具,能够有效提高网络的可靠性和稳定性,降低网络维护成本,提升服务质量。在未来,随着 5G、物联网等新兴技术的快速发展,网络规模将进一步扩大,对网络维护的要求也将更加严格,ETH OAM 有望在更多的领域得到应用和拓展,为构建更加智能、高效的网络环境发挥重要作用。