如何定義 Network Latency SLOs? 4 個設計原則與百分位數解析

Note

衡量你想要監控的內容意義,不要只監控您碰巧能夠輕鬆監控的內容

Service Level Objectives (SLO) 可以讓你清楚的理解現在系統運作的狀況,但它背後的數字代表意義是需要透過一連串的數字統計和計算而得的。而最近無論是設計跨國網路,雲地混合網路,都會遇到一個關鍵元素: Latency 延遲,對於資料傳輸來說,延遲是一個很重要的指標,因此我們需要一個方法來定義這個指標,這篇文章就是要來介紹如何定義 Network Latency SLOs

使用 OpenAI API 開發經驗分享

Note

因 OpenAI 相關技術發展神速,本文有效時間可能不算太長,閱讀後務必要自行再用自身經驗驗證

很久沒寫 Python,但我本來只是想要研究一下 APM (Application Performance Monitoring) 怎麼順利地跑在 AKS 和 ARO 上,然後就不小心就把 Line Bot ft. OpenAI 寫一寫了,既然寫了就順便紀錄一下

TL;DR

  1. Azure OpenAI Service 和 OpenAI 的 API 呼叫有可能會不一樣,務必要確認
  2. Error Handling 建議要做,不然你永遠只會收到 500 Internal Server Error
  3. 私有網路連入方式,唯一選擇 Azure OpenAI Service

運用 Testinfra 來確保網路連通性測試

Testinfra test your infrastructure

起源是因為做 Azure 網路架構設計,網路線拉完 (ExpressRoute、S2S VPN、VNet Peering 等) 之後,下一個需求多半都是要把 Firewall 開起來,希望所有的連線都要經過 Azure Firewall 確保連線安全性,但基於 Azure Networking 本身的特性和使用者的對於網路連通 (Network Connectivity) 的需求,身為一名記憶力不算特好的架構師,為了確保使用者講的跟實際上運作的結果是一樣的,這時候就要把早年在 Edgecore Network 時期講過的 NetDevOps: Next-Generation Network Engineer 拿來用用了