網路科技
繁體 簡體 RSS feed | | 轉寄

〈設備備援 經驗公開〉

文◎tjm

沒有人可以保證電腦系統永遠正常運作,唯有「常備份」、「多備援」才能讓資料的損失減到最低,才能由電腦系統的危機中復原過來。

 特別是在SARS疫情嚴重的時候,誰也不知道技術人員何時會不幸染病被隔離。所以電腦系統的風險管理是很重要的課題。

●權宜分散風險

 以筆者所經營的信望愛資訊中心為例,為了讓電腦系統維持正常運作,從以前到現在,逐步形成了一套風險管理體系。

 好比早期我們因為技術人員無法常接觸到機器,大都從遠方遙控機器,而系統出問題時必須做到儘速由備份中復原資料,所以那時採硬碟配合網路備份的方式,來保護系統資料。

 當初的策略如下﹕除了「信望愛母站」的架設外,還有一個「彼得分站」做備援。萬一母站陣亡,還有分站起來。而兩台機器系統的硬碟中,存放昨天與前天的備份資料,每天四點鐘(透過系統的紀錄,我們知道每天晚上三點到早上七點系統使用率最低)啟動備份程式(使用 Linux 內附的 GNU tar)來壓縮備份系統資料,並移除前天的資料。

 整個硬碟備份的工作大約在早上六點左右可以完成。而在工作硬碟中的兩份備份資料,則由三位技術同工分別在週一、週四,週二、週五,週三 、週六的六點半,透過網路下載到自己電腦裡的備份硬碟中保存。

 整個網路備份,大約在早上九點以前會完成。有很長一段時間我們滿足於這樣的備份方法,也很有效的解除幾次「誤殺」或系統損壞的危機。

 自從信望愛站遷出學術網路,我們改用磁帶備份,以取代早期的備份硬碟與網路備份配套的備份策略。後來又因磁帶機損壞,改採了DVD+RW 來備份。詳細的策略說明如下﹕

 因為連線速度增快,有許多身在國外的網友也會進入信望愛站,因此沒有讓整個備份的過程太長,以免影響國外網友使用。

 此外,也考慮到能保留比較長時間的備份量,於是我們選用外接式 HP 的 DDS-2 DAT 機器(一卷磁帶可以備份 4-8GB)來當備份設備,我們一共利用十一卷磁帶,做到三台機器三個月的備份量。

 每天凌晨開始,WWW 主機、Life 主機和 Tech 主機各自依序把檔案透過 tar 與 openssh 壓縮 存放至 tech 機器上的磁帶中,而每部機器備份的開始時間必須控制在前一部機器備份結束之後。 這整個程序大約在六點半前結束,如此完成了一天的備份工作。

●磁帶到DVD+RW

 這十一卷磁帶,其中五卷各備份週二到週六凌晨的使用者資料。有三卷備份每個月前三個禮拜的使用者資料(在週日凌晨備份),有兩卷備份前兩個月的使用者資料(在第四個禮拜的週日凌晨備份)。最後一卷在每週一的凌晨用來備份系統設定的資料。而每一卷磁帶可以備份 100 次以上(亦即以目前一個禮拜使用一次,可以供兩年以上的備份使用)。

 後來磁帶機損壞,重新購買的話價格高昂,於是我們改用DVD+RW 配合IDE硬碟來備份。備份原理跟磁帶差不多,只是不直接放入備份媒體中,而先放入一個60G的IDE硬碟,直到週日再燒錄出來。

 燒錄出來的DVD+RW片,則送到離主機三、四公里遠的另一位同工家,確保資料的安全。目前隨著系統資料量增加,我們也在評估USB 2.0硬碟外接盒來當備份媒體的可行性。

●人力也分組備援

 除了高雄原本的三台機器外,信望愛也在北部借用懷恩堂的一間房間,設立分站機房(有兩台機器),北部也有一群技術組同工。萬一高雄發生水災,台北的機器還可以正常運作。萬一台北地震,高雄的機器也可以正常運作。

 在北高兩地的機房,其網路專線也是做到雙線路(各兩條雙向512K ADSL)。萬一一邊線路不通,另外一邊還可以通。

 如今因應 SARS,信望愛站亦重新將義工人力編組,萬一一個義工不幸染病住院,還有下一個義工可以承接其事工。在這多重人力備援編制下,以確保信望愛站在各種天災人禍都能正常運作。

 以上是信望愛資訊中心簡單的風險管理措施分享,希望能對一些教會機構有所幫助。當然最終一切還是要仰望上帝,只有祂才是一切正常運作的保證。

註:「韋伯麥司特」就是webmaster,tjm與陳小小兩人共用的筆名。

回首頁|前期文章索引 « 上一篇|下一篇 »