今天是:   欢迎访问通信维护技术行业的门户网站!  
设为首页
加入收藏
网站地图
首页 > 通信技术 > 传输技术 >
分享到: 收藏

PTN专线业务故障案例
2019-06-20 10:59:49   来源:   评论:0 点击:

XX移动用PTN网络新开一条邮政专线,PTN是点对点开的专线业务,邮政客户需要在这链路上需要通过三个VLAN,两个生产VLAN,一个OA用的VLAN,故障现象:两个生产VLAN能正常通过使用,OA用的VLAN不通,ping测无法通过。

 
问题描述
  某日接到工程部工单,新开通100M点对点专线需要PTN设备承载,传输中心将电路做好后,现场测试人员反馈业务不通。
处理过程
1、Tunnel隧道配置错误不通,或者由于光缆中断并且Tunnel没有倒换成功。
2、由于PW配置错误导致业务不通。
3、由于对接的端口属性配置错误导致业务不通。
根因
  经过对Tunnel和PW的配置进行仔细检查,是没有问题的;最后原因定位在由于对接的端口属性配置错误引起的。
解决方案
1、核查源宿两端的端口告警,端口状态为使能,并且无任何告警。
2、通过PTN网管查询工程查询Tunnel的LSP状态是正常的。
3、查询PW和VLAN ID是正常的。
4、将源宿两端的FE端口的模式由自协商改为100M全双工,端口属性的TAG标识由TagAware改为Access。
以上步骤处理完成后,与现场测试人员联系,反馈业务恢复正常。
建议与总结
  在用PTN开通集团客户专线、TD、WLAN等一些业务时,需要注意端口的Tag标识和端口的工作模式。
 
  XX移动用PTN网络新开一条邮政专线,PTN是点对点开的专线业务,邮政客户需要在这链路上需要通过三个VLAN,两个生产VLAN,一个OA用的VLAN,故障现象:两个生产VLAN能正常通过使用,OA用的VLAN不通,ping测无法通过。
 
  传输上做了条点对点VLAN全放通的业务,总点与分点的端口设置一致,业务封装协义为802.1Q,端口自协商,二层属性为TAG Aware。目前用于生前的两个VLAN能正常通正常使用,OA VLAN不通,在网点华为S2700交换机侧用PC机ping总点,能ping通1480以下的包,ping不通1480以上的包。 
而能正常使用通过的生产VLAN  能ping通大包 。
  客户反馈把中间的PTN网络撇开换成网线,或者电信的裸光纤,交换机端口不变,三个VALN能正常通过,能正常使用。
处理过程
1、由于大包不通,小包能通过,怀疑是MTU值的问题,在PTN侧将端口,所有链路所经过的端口更改MTU值,最大帧长度,客户更改两侧路由器的MTU值,再进行ping测试,问题依旧。
2、客户将网点华为S2700交换机更换为华三S3100交换机后,两个生产VALN能通,OA VALN不通,小包也不能通过,可以排除MTU值的问题。
3、在PTN与路由器上更换端口协商模式,封装协议,二层属性,问题依旧。
4、根据800的方案,让客户在分点与总点交换机上各接一台PC机进行互ping,通过核查PTN链路的收发包,分析流量通过性况,在长ping的情况下,总点路由器收发包正常,但是分点交换机返回的包数据丢失,分析可能是交换机上有协议通不过PTN网络,咨询交换机支持,说不存在协议。
5、让客户一直长ping OA VLAN所使用的网段,刚开始ping提示找不到主机,长ping一段时间后就能正常通。
而后发现,OA的VLAN地址段,有部分长ping一段时间能通,有部分IP不能通,重启网点PC机之后,又能通。 
通过ping测分析,网络断续时正常时断,有可能是协议或对接过程中或VLAN的问题,由于客户的VALN是省公司统一分配不能更改此项暂时排除,协议的问题也咨询过交换机支撑问题点也不在这,客户说祼光纤能通,和客户沟通找另外的光纤资源再次进行祼光纤测试。
6、邮政客户利用他们邮政大院的祼光纤进行测试,也出现了生产VLAN能通,OA VLAN不能通的情况,和客户详细讨论了两次祼光纤测试的时候是怎么连接配置的,客户说测试时配置为:总点三层交换机--光纤收发器--光纤--光纤收发器---两层交换机这样的结构。但是客户反馈第一次用裸光纤测试时,光纤收发器是单模单纤的光纤收发器,第二次是光纤收发器用的是单模双纤的。为了进一步验证测试,客户从其他地方找来单模单纤的光纤收发器,将此次的单模双纤光纤收发器更换为单模单纤光纤收发器,交换机进行ping测试,能正常通过。
此时已经可以定位为光纤收发器的问题,和XX运营商分公司沟通,不确定有没有单模单纤的收发器,给出另一套方案,将新挂一套PTN设备到客户交换机房,不通过光纤收发器,PTN设备直连交换机。
最后测试 业务正常,数据包流量也正常,ping测试也正常,业务已能正常使用,问题解决。
 
根因
设备与客户设备之间如通过第三方设备对接,定位时应该先撇开第三方设备,尽量不通过第三方设备,优先直连,然后再进一步排查。
解决方案
PTN设备与客户设备对接如有第三方设备,尽量不通过第三方设备对接,优先直连。
建议与总结
PTN设备与客户设备对接,尽量不通过第三方设备对接,优先直连。
 
PTN业务中断紧急处理流程
 
根据现网中处理网元脱管或业务中断等故障的经验,一般遵循“一分析,二倒换/复位,三换板”的处理方案。为保证PTN网络的稳定运行,尽量减少突发事故,请遵照《OptiX PTN 7900-32 PTN系列分组传送平台 例行维护》,做好设备的日常维护。
 
处理故障之前的信息采集

处理故障之前,及时采集与记录故障的相关信息,有助于故障的快速定位和排除。

故障分析和定位

处理故障时,应从分析故障现象开始,尽快定位到故障的原因。本节介绍各类分析和定位故障的方法的特点、应用场景和应用示例。

通过保护倒换或设备复位恢复业务

如果一时无法定位到故障原因进而排除故障,可以先将业务倒换到正常的路径上,或者复位相关的网元或单板,以恢复已中断的业务或已脱管的网元。

通过更换单板恢复业务

如果一时无法定位到故障原因,又没有备用路由用于业务倒换,而且复位单板无效时,需要考虑更换单板。事实上,很多故障的最终处理方案就是更换单板。

业务中断故障的应急处理

介绍业务中断故障的应急处理流程。
 
 
故障分析和定位
处理故障时,应从分析故障现象开始,尽快定位到故障的原因。本节介绍各类分析和定位故障的方法的特点、应用场景和应用示例。
基本原则

故障定位的基本原则总结为三句话:先主后次、由外而内、逐步深入。

常用方法比较

处理故障时,应从分析故障现象开始,定位到故障的原因。本节介绍各类分析和定位故障的方法的特点、应用场景和应用示例。

告警分析法

告警分析法是定位故障的常用方法之一。当设备发生故障时,一般会伴随着告警产生。通过对告警的分析,可大概判断出发生故障的类型、时间和位置。

性能统计分析法

单板性能统计分析法是通过“当前性能”和“RMON性能”来分析单板、端口、Tunnel、PW的性能统计数据是否正常,以此来判断是否存在故障。

OAM分析法

OAM机制可以有效地检测和监控各个层面的内部运行状态。通过相应的OAM功能,可以实现故障点的定位或运行状态的监控。

配置数据分析法

配置数据分析法是通过在网管上分析业务的配置参数,找到不合理的配置,从而定位故障。

仪表测试分析法

仪表测试分析法是通过外部介入的方式来判断网络运行状态,一般用于定位设备的外部问题及其它设备的对接问题。

环回测试分析法

环回法是一种通过环回隔离的方式将故障点逐步缩小范围,进一步准确的定位到单站,甚至单板的方法。

排除法

排除法是通过在复杂的故障现象中分析故障的共同点,排除运行正常的部分,以缩小故障范围的方法。

相关热词搜索:PTN 专线 业务 故障 案例

上一篇:光纤到户(FTTH)线路检测系统
下一篇:20大5G关键技术