为方便排查错误,监控一个microservice对每个请求都要测量4个指标:开始请求的次数、请求结束的次数、处理请求的时间分布、正在处理的请求数。

当代互联网公司里很多小组都是按 microservice 划分的。你们组负责的 microservice 要与其他组负责的 microservice 通讯,如果通讯失败导致重大事故,该怨谁?如果没有收集可靠的指标留作证据,组与组之间的撕逼大战在所难免。

分享到: