Overwatch是 一款可用于分布式系统的通用 RPC 开源监控系统, 基于D3 force 作为主要图表。提供了整个系统当前状态的概览,使系统管理员能够轻松了解正在进行的 RPC 事件并找出系统中故障的来源。

图示意义:

  • 每个圆圈代表一个系统
  • 每一行代表两个系统之间的依赖关系
  • rpm = 每分钟请求数,fpm = 每分钟失效数
  • 圆圈大小表示系统的转速
  • 线破折号密度表示两个系统之间的转速
  • 圆圈颜色表示系统在最近1分钟内的健康状况
  • 圈外另外两个环表示系统过去5分钟和15分钟内的健康情况