网路科技
繁体 简体 RSS feed | | 转寄

〈设备备援 经验公开〉

文◎tjm

没有人可以保证电脑系统永远正常运作,唯有「常备份」、「多备援」才能让资料的损失减到最低,才能由电脑系统的危机中复原过来。

 特别是在SARS疫情严重的时候,谁也不知道技术人员何时会不幸染病被隔离。所以电脑系统的风险管理是很重要的课题。

●权宜分散风险

 以笔者所经营的信望爱资讯中心为例,为了让电脑系统维持正常运作,从以前到现在,逐步形成了一套风险管理体系。

 好比早期我们因为技术人员无法常接触到机器,大都从远方遥控机器,而系统出问题时必须做到尽速由备份中复原资料,所以那时采硬碟配合网路备份的方式,来保护系统资料。

 当初的策略如下:除了「信望爱母站」的架设外,还有一个「彼得分站」做备援。万一母站阵亡,还有分站起来。而两台机器系统的硬碟中,存放昨天与前天的备份资料,每天四点钟(透过系统的纪录,我们知道每天晚上三点到早上七点系统使用率最低)启动备份程式(使用 Linux 内附的 GNU tar)来压缩备份系统资料,并移除前天的资料。

 整个硬碟备份的工作大约在早上六点左右可以完成。而在工作硬碟中的两份备份资料,则由三位技术同工分别在周一、周四,周二、周五,周三 、周六的六点半,透过网路下载到自己电脑里的备份硬碟中保存。

 整个网路备份,大约在早上九点以前会完成。有很长一段时间我们满足於这样的备份方法,也很有效的解除几次「误杀」或系统损坏的危机。

 自从信望爱站迁出学术网路,我们改用磁带备份,以取代早期的备份硬碟与网路备份配套的备份策略。后来又因磁带机损坏,改采了DVD+RW 来备份。详细的策略说明如下:

 因为连线速度增快,有许多身在国外的网友也会进入信望爱站,因此没有让整个备份的过程太长,以免影响国外网友使用。

 此外,也考虑到能保留比较长时间的备份量,於是我们选用外接式 HP 的 DDS-2 DAT 机器(一卷磁带可以备份 4-8GB)来当备份设备,我们一共利用十一卷磁带,做到三台机器三个月的备份量。

 每天凌晨开始,WWW 主机、Life 主机和 Tech 主机各自依序把档案透过 tar 与 openssh 压缩 存放至 tech 机器上的磁带中,而每部机器备份的开始时间必须控制在前一部机器备份结束之后。 这整个程序大约在六点半前结束,如此完成了一天的备份工作。

●磁带到DVD+RW

 这十一卷磁带,其中五卷各备份周二到周六凌晨的使用者资料。有三卷备份每个月前三个礼拜的使用者资料(在周日凌晨备份),有两卷备份前两个月的使用者资料(在第四个礼拜的周日凌晨备份)。最后一卷在每周一的凌晨用来备份系统设定的资料。而每一卷磁带可以备份 100 次以上(亦即以目前一个礼拜使用一次,可以供两年以上的备份使用)。

 后来磁带机损坏,重新购买的话价格高昂,於是我们改用DVD+RW 配合IDE硬碟来备份。备份原理跟磁带差不多,只是不直接放入备份媒体中,而先放入一个60G的IDE硬碟,直到周日再烧录出来。

 烧录出来的DVD+RW片,则送到离主机三、四公里远的另一位同工家,确保资料的安全。目前随著系统资料量增加,我们也在评估USB 2.0硬碟外接盒来当备份媒体的可行性。

●人力也分组备援

 除了高雄原本的三台机器外,信望爱也在北部借用怀恩堂的一间房间,设立分站机房(有两台机器),北部也有一群技术组同工。万一高雄发生水灾,台北的机器还可以正常运作。万一台北地震,高雄的机器也可以正常运作。

 在北高两地的机房,其网路专线也是做到双线路(各两条双向512K ADSL)。万一一边线路不通,另外一边还可以通。

 如今因应 SARS,信望爱站亦重新将义工人力编组,万一一个义工不幸染病住院,还有下一个义工可以承接其事工。在这多重人力备援编制下,以确保信望爱站在各种天灾人祸都能正常运作。

 以上是信望爱资讯中心简单的风险管理措施分享,希望能对一些教会机构有所帮助。当然最终一切还是要仰望上帝,只有他才是一切正常运作的保证。

注:「韦伯麦司特」就是webmaster,tjm与陈小小两人共用的笔名。

回首页|前期文章索引 « 上一篇|下一篇 »