新聞 | iThome ( ) • 2024-03-28 12:51

2年前,高雄兴达电厂一起跳机事故,影响变电所后产生的连锁效应,导致多地发电机组因保护机制而自动解除供电,全台三分之一的电力瞬间消失,引发了全台大停电,北、中、南多个县市都出现了停电灾情,影响高达549万户,有些地区停电不只是1、2小时,甚至超过了半天。

这样大规模的停电灾情,对IT系统而言是最严峻的考验,尤其是超过12小时的停电,许多备援电力系统,不见得有能力支持那么久,唯一解法是切换到远地备援资料中心来接手提供服务。但是,若像2年前这起兴达电厂事故,甚至是921大地震,全台各地都出现灾情,IT系统根本无法在台湾岛内,找到稳定可接手的备援机房,那该怎么办?

十年前,遇到这样大规模的灾情,IT真的是束手无策,但在2024年的此刻,跨国公云架构和服务已经高度成熟,足以在紧急时刻成为关键的备援。

不过,想要借助跨境公云来备援,不是事故发生了临时想切换就能做到,得有一番事前准备工作才行。你的IT系统得先有能力上云,并且事先在云端有一套完整的系统备份,才能在遇到紧急情况时启用,不只如此,平时还得将地端系统的资料,定期同步到云端,才能让云端的备援系统,接手提供同样的服务和最新的资料。这正是未来4年,18套关键民生系统想要具备的能力。数位部联手7个部会,4年累计投入13.4亿元,要让这些关键民生系统,可以支援境外公云。

现行政府部门的异地备援、备份机制,只能够因应小规模的灾难,像是台风淹水、机房失火,可以改由30公里外的实体备援机房来接手,若是遇到了超大规模的灾情,连备援机房都失效,就没有办法应变。

数位部选了18套重要的民生相关系统,比如像内政部的户役政系统、移民署的入出国查验系统、财政部国税与地税系统、健保署的健保承保系统、经济部的公司与工厂管理系统等,从两大作法著手,展开这些关键系统的韧性大改造。一方面将这些系统的核心功能上云,另一方面则是将新颖的资料备份到云端。

为了将核心功能系统上云,今年这些民生相关系统的所属部会,已经盘点出灾害或紧急状态需要的基本功能服务,准备开始利用云原生架构,来开发轻量化的核心功能系统版本,可以用来部署至跨境的公有云上。

日后,一但发生了大规模灾害或紧急状态,境内资料中心遭到破坏,就能紧急切换到境外公云上的核心功能系统来接手,继续维持这些基本服务的运作。

因为这些关键系统都是民众天天都会用到的系统,每天都会有资料更新和异动。因此,政府也会将这些关键民生系统的新资料,尽快备份到云端,透过境外公云来保存。不过,政府不是直接将系统资料储存到云端,还得经过一番加密分持来备份。

为了能够确保在需要日后备援时,能顺利重建系统、还原资料。政府机构还要建立一套流程和作法,定期演练云、地系统的切换,来验证这些资料云端的备份和还原工作,以备不时之需。

在这18套关键民生系统中,有不少系统是用了十多年的老系统,像是财政部税务系统就是如此,正面临了汰换的阶段,财政资讯中心就考虑趁这个韧性改造的机会,将部分功能切分,优先改以云原生架构开发,利用云原生架构的弹性,来因应服务使用离尖峰的需求。

对这些政府机关而言,这次关键民生系统的韧性大改造,也正是一趟推动IT架构现代化、学习云原生技术的转型过程。从中累积的经验和能力,不只可以用于关键民生系统,还可以扩大运用到其他政府服务上。

虽然只是18套关键民生系统的上云改造,但却是政府IT韧性的关键一步,更是政府数位转型最重要的改造工程。

 相关报导