就在刚刚,德国发生T0级重大事故——德国铁路公司突然宣布全国铁路暂停运营,原因竟是自家系统的IT故障!
提起德国轨道交通,长久以来外界都会将其与精密工业、稳定运维绑定,可一场突如其来的全域系统崩溃,直接打破了大众对德铁运营能力的固有印象。
当地时间6月23日,德国铁路遭遇定级为T0级别的最高等级技术事故,国内全部铁路线路同步陷入停摆,从城际高速列车、区域通勤轻轨到长途货运列车全部紧急停运,横跨德国16个联邦州的交通路网彻底断联。
22时30分,德国铁路官方对外发布紧急停运通告,同步推送至全国各大火车站电子显示屏、线上订票平台。
不止德国国营铁路受影响,Metronom等多家私营铁路运营企业也同步下达全线停驶指令。
支撑列车安全运行的核心GSM-R铁路专用移动通信系统彻底失效,这套IT系统承担着调度中心、列车司机、沿线运维站点三方实时通信功能,行车预警、紧急制动指令、线路调度安排全部依靠该系统传输。
按照德国铁路安全管理条例,一旦全域通信链路中断,无法实时把控每一趟列车动态,为规避相撞、脱轨等重大安全风险,必须立刻终止所有轨道车辆运行,这也是本次全路网同步停运的硬性规定。
短短半小时内,德国各大核心火车站迅速挤满滞留旅客。
柏林、法兰克福、慕尼黑、科隆等枢纽站点的咨询窗口前排起数十米长队伍,不少原本计划夜间跨城通勤、长途出行的民众被困站台。
部分停靠在中途轨道上的列车原地静止,车厢内乘客无法下车,也接收不到准确的恢复通知。
有法兰克福候车旅客透露,凌晨0时30分首批恢复运营的高铁发车时,车站没有同步广播提醒,整趟前往斯图加特方向的列车近乎空载驶离,大批等候多时的旅客错过复行班次,只能继续滞留车站。
大量旅客深夜无法抵达目的地,德铁随即启动预设应急处置方案,向滞留人群发放出租车报销券与酒店住宿抵扣凭证。
但当晚各大城市周边酒店客房全部满房,不少老人、学生、带孩子的家庭只能在车站座椅、大厅地面过夜,漫长的等待过程里,车站仅能提供少量饮用水与简易零食,基础安置物资储备明显不足,旅客不满情绪持续发酵,相关现场画面在德国社交平台快速传播,引发大范围讨论。
凌晨2点过后,技术运维团队逐步定位故障节点,确认此次全域瘫痪不存在外部入侵因素,完全是内部IT系统更新调试时出现的底层程序故障。
工作人员当日晚间对GSM-R系统进行常规组件升级,新版本程序与底层硬件适配出现冲突,系统底层服务直接崩溃,且整套通信网络缺少多层级备用冗余链路,单一区域故障直接传导至全国服务器集群,没有分段隔离止损的机制,最终造成全国同步失灵。
德国铁路安全监管部门将此次事件划定为T0级事故,该等级代表国家级交通基础设施全域失效,属于铁路运维体系中危害程度最高的事故分类,仅在全国路网完全停摆时才会启用该定级。
截至24日上午,各地线路分段完成系统重启调试,路网逐步恢复通车,但大面积延误、车次取消的情况持续了一整天。
据德铁统计,当日累计超过1200趟客运列车取消,近3000趟车次晚点时长超过90分钟;
陆路货运同样遭受重创,德国65%陆路货运依靠铁路输送,大量生鲜、工业原料运输班次停滞,部分工厂原料供应出现短时缺口,短途公路运输压力瞬间暴涨,高速路段出现多段长时间拥堵。
德国联邦铁路安全监管局首席专家施泰因第一时间参与事故复盘磋商,他在现场直言,这次T0级故障暴露德国交通基建长期存在的短板。
德国铁路日均客运承载量稳定在420万人次,覆盖居民日常通勤、跨城商旅、长途旅游等多重出行需求,一套自研核心IT系统没有完善的备用防护机制,仅凭单次软件更新就击穿全国路网,这种脆弱性很难让人信服。
此前2022年德国北部区域也曾出现同系列通信系统故障,当时仅局部线路停运3小时,相关部门并未针对系统冗余、故障隔离机制完成全面整改,时隔数年再次爆发规模更大的全域事故,足以看出日常运维排查存在明显疏漏。
单一IT系统故障撬动国家级交通大动脉停摆,这件事带来的警示十分直观。
工业体系向来以严谨精密著称的德国,在关键交通软件系统的风险防控上出现明显短板,核心运营系统过度依赖单一技术架构,缺少多套独立备用通信渠道,一旦主系统出现程序、硬件问题,没有缓冲补救空间。
同时日常系统升级流程缺少全范围压力测试,仅完成局部调试就上线新版本,忽视跨区域服务器联动可能产生的适配冲突,运维流程存在明显漏洞。
信息来源:联合早报


