容錯系統(一)
容錯系統(一)
1.motivation for fault tolerance
2.recommended materials
3.Faults, Errors, Failures
1.motivation for fault tolerance
老師的PPT上,提出五種類別的應用,舉例來說:
1.長時間的應用:像是太空探索的儀器
2.重要運算:核子爐
3.維修不易:深海探測系統
4.高使用率:航班訂票系統, 銀行系統
5.短期高可靠度:飛機控制系統
2.recommended materials
書本:reliable computer systems design and evaluation (實驗室有第二版)
Journal Reading:
IEEE Transactions on Reliability 數學較多,很多機率模型
IEEE Transactions on Computer 應用最廣
Conference Proceedings
DSN:最難上,之前叫FTCN
PRDC:Pacific Rim International Symposium on Dependable Computing:較容易投,2018在台北舉行
3.Faults, Errors, Failures
再看到此知識點時,想起焦老師在軟工提到的概念,但是腦中回想後,只記得failure是最嚴重、error是次嚴重。
於是,看了PPT的定義:
Fault: is a physical defect, imperfection, or flaw within hardware or software component // 像是線路中,某些區段短路
Error: is that part of system state which is liable to lead subsequent failure //強調 state 的變化,與可能造成failure的後果
Failure: is a nonperformance of some expected service // 強調非預期的結果
後來,我查看《software engineering》,發現在“reliability engineering”部分,提到了 "system Faults ,System Errors,System Failures"的差別,當中用 "weather system"的時間設定23:00 to midnight之間的情況考量,現在想起印象十分深刻。
Last updated
Was this helpful?