Skip to content

2023

計算出正確的服務水平協議:探索 Composite SLAs 計算和架構設計

最近這幾周收到幾個想要做 SLA 99.999% 的案子,因涉及的服務眾多,所以故針對如何合理計算 SLA 和其架構設計先做一個紀錄,但這邊並不涉及資料最終一致性和對外網路的設計討論

TL;DR

  1. 相比單一服務 SLA 計算,複合 SLA (Composite SLA) 是更為合理的計算方式
  2. 複合 SLA (Composite SLA) 會隨認列範圍不同而有所變化,就算是同一張架構圖
  3. 若相依性服務越多,因可能失敗發生點多,則複合 SLA 會必然低於單一服務 SLA
  4. 單區域架構提供多個備援作法可小幅提升整體 SLA
  5. 多區域架構設計可以大幅提升整體 SLA,至少 2 個區域,至多 3 個區域

如何定義 Network Latency SLOs? 4 個設計原則與百分位數解析

Note

衡量你想要監控的內容意義,不要只監控您碰巧能夠輕鬆監控的內容

Service Level Objectives (SLO) 可以讓你清楚的理解現在系統運作的狀況,但它背後的數字代表意義是需要透過一連串的數字統計和計算而得的。而最近無論是設計跨國網路,雲地混合網路,都會遇到一個關鍵元素: Latency 延遲,對於資料傳輸來說,延遲是一個很重要的指標,因此我們需要一個方法來定義這個指標,這篇文章就是要來介紹如何定義 Network Latency SLOs