【錯誤容許系統】 Fault-TolerantSystems
【辭書名稱】圖書館學與資訊科學大辭典
錯誤容許系統是指當電腦發生故障或出現偶然錯誤時,電腦能自動採取一些措施來彌補,使得故障影響變得最小,而電腦仍能繼續而正確地執行任務的系統。
在設計的初期,須考慮系統的完整性及效率比例的要求,尤其是要有硬體、軟體或兩者兼具的備用裝置,才能將錯誤隔離以取得正確的結果。
錯誤容許系統組成要素為錯誤察覺、錯誤更正、錯誤診斷和錯誤修復等4種,分述如下:(一)錯誤察覺:可利用硬體或軟體來完成。
硬體的察覺方式有重覆檢查、編碼檢查、計時檢查和例外檢查。
這些檢查可以直接放置在內部的功能單元或其他的界面上。
硬體檢查裝置可以在系統運作的同時進行偵錯工作。
軟體檢查則較為困難,只能靠檢查系統有無不尋常的情形出現才能知道。
所以需在執行運算動作的每個階段同時作程式執行的合理性檢查。
(二)錯誤更正:能重新載入系統正確的狀態值,或讓系統從完全初始狀態重新執行。
程序為整體更正、讓步更正和安全關閉、重新組合。
整體更正需要有備用副系統來更換損壞的副系統。
讓步更正可讓系統恢復到沒有錯誤的狀況。
安全關閉又稱安全損壞作業,系統發生錯誤而無法再正常運作時,必須依一定的順序逐步關閉所有的處理行程,直到系統恢復正常後,再逐一載入正確的狀態繼續正常的運作。
重新組合是能隔離與刪除故障的模組,代之另一正常的模組。
(三)錯誤診斷:能找出已被更換的系統問題之所在。
利用硬體錯誤察覺裝置和測試序串來協助找出錯誤的來源。
開始會先檢查硬體核心部分,再由最內部逐一檢查到最外層,直到整個系統都檢查過後才停止。
當診斷出錯誤並予以隔離在某些套裝線路中時,維護人員便需要一一代換這些電路,直到找出錯誤為止。
(四)錯誤修復:偵錯程式的完整性和正確性,直接影響到系統修護時所花的時間。
一般選購電腦時,價格固然是考慮的主要因素,但是系統的可靠度也不能忽視。
尤其現在電腦普遍應用到各行各業,許多工作皆靠電腦來完成。
如果錯誤帶來困擾很嚴重的話,則必須考慮加入更完備的容錯系統,以確保電腦運作的可靠度。
轉自:http://edic.nict.gov.tw/cgi-bin/tudic/gsweb.cgi?o=ddictionary
|