InfoQ 推荐 ( ) • 2021-10-15 14:20
你是否正面临着产品迭代在不断提速(催进度、要deadline)的同时,服务产线BUG/故障也在变多、有大量用户投诉要响应,每天都要花大把时间去处理突发情况、去救火,而无法把主要精力都投入到正常项目中的糟糕的工作状态。
我们的尝试:技术债务识别及优化追踪 基于链路分析找出潜在的风险:1、慢接口:慢,会严重影响整个服务的吞吐量,最终反映到用户体验上,造成客户流失。
参考文献:[注1] 赵诚《SRE实战手册》第01|SRE迷思[注2] MTTR/MTTF/MTBF图解[注3] 赵诚《SRE实战手册》第02|系统可用性[注4] 《架构整洁之道》第2章 艾森豪威尔矩阵[注5] 《架构整洁之道》第17章 划分边界[注6] 《架构整洁之道》第14章 稳定依赖原则作者简介:方勇:好大夫基础架构部高级工程师,专注于 SRE、微服务、中间件的稳定性和可用性建设,整体负责好大夫服务治理云平台的设计和搭建 ... 阅读全文