服务端线上接口监控实践

摘要:
背景最近上线了一个新的服务,这个服务有一个特点就是接入了n个第三方的数据服务,前端通过不同参数请求被测服务端,服务端根据参数不同proxy_pass到不同的后端服务器获取数据,处理后吐给前端展示;问题被测服务和后端服务都上线后,发现了一些问题1、第三方服务器可能会宕机,导致线上的被测服务功能不正常;2、现有的报警机制是基于对服务存活的检查,无法检查功能逻辑是否正常;问题分析现有的监控程序是对线上服
背景

最近上线了一个新的服务,这个服务有一个特点就是接入了n个第三方的数据服务,前端通过不同参数请求被测服务端,服务端根据参数不同proxy_pass到不同的后端服务器获取数据,处理后吐给前端展示;

问题

被测服务和后端服务都上线后,发现了一些问题
1、第三方服务器可能会宕机,导致线上的被测服务功能不正常;
2、现有的报警机制是基于对服务存活的检查,无法检查功能逻辑是否正常;

问题分析

现有的监控程序是对线上服务器进行服务进程存活检查,当进程挂掉才会报警,但是有一些情况cover不到,比如后端服务挂了,那么被测服务进程还在,但是当客户端请求时,无数据返回;

解决方案

使用脚本模拟客户端不同参数的请求,验证接口返回码200的同时,验证数据内容的正确性;
例:http://abc.sogou.com?type=music,会请求后端music服务器,正常情况下有内容{“name”:”abc”}
使用python的requests库请求服务端获得返回码&返回body,验证jsonobj中 含有key = name & value = abc
当有检查点失败时,向指定邮箱发报警邮件;
ps:之前偷听到一个小技巧,报警邮件可以指定到QQ邮箱,这样有报警邮件就能及时收到,因为微信有QQ邮箱的收件提醒,是不是想说一声,卧槽~这都可以~

衍生问题

1、case维护麻烦,因为使用python unittest框架,需要将检查点和请求参数维护到代码里,这样新增case比较麻烦
2、由于case维护在代码中,查看已有case也比较麻烦;

解决方案

1、将case和检查点存在db中,修改python脚本,从db中获取case和检查点,并执行

整体流程图

服务端线上接口监控实践第1张

添加case

服务端线上接口监控实践第2张

  • 自定义参数组合、预置一些通用检查点,根据实际参数组合的预期返回值,勾选检查点

  • 执行脚本根据db中这条case写入的检查点选择执行assert

  • 后端提供一个查询db的接口,供前台页面展示case列表(如下)

服务端线上接口监控实践第3张

存在问题

1、目前这套系统最大的问题是扩展性不好,耦合度较大,后面可以通过完善配置的方法解耦,并增加可扩展性;

免责声明:文章转载自《服务端线上接口监控实践》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇Windows下Kettle定时任务执行并发送错误信息邮件移动端touch事件影响click事件以及在touchmove添加preventDefault导致页面无法滚动的解决方法下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

随便看看

【使用 DOM】为DOM元素设置样式

DOCTYPE html˃设置DOM元素的样式p{border:中双绿色;背景颜色:浅灰色;}#block1{color:白色;}table{border:thinsolided;border collapse:collapse;margin:5px;float:left;}td{padding:2px;}#block2{color:yellow;font-...

关于利用RD client远程电脑,和输入法的一些问题

我在寝室,利用转接头,借助手机app“RDclient”成功完成在键盘上输入文字,并在电脑上输出内容。“RDclient”可以完成手机端远程连接电脑端,只需要知道电脑的ip,用户名和密码就可以。“RDclient”这是微软自家发布的软件,还是很不错的。不过,在刚开始连接的时候,输入法遇到一点问题。后来,在手机上,调出输入法打字的界面,更换成英文输入模式,然后...

【转】MUD教程--巫师入门教程4

在MUD中,为了解决定时触发某种现象,一般有两种方法,一种是通过call_out()延时呼叫,另一种就是通过心跳。于是,对于要跨起离线前后的象做牢这类的事,大多都是采用condition。附:由于大多数MUD里的心跳是每两秒调一次,5+random是5至14次,因此可以看出每一个condition被调用的时间是平均19秒。然后它会按照condition的名字...

面试了一个 31岁的iOS开发者,思绪万千,30岁以上的程序员还有哪些出路?

前言之前HR给了我一份简历,刚看到简历的第一眼,31岁?31岁,iOS开发工程师,工作经历7年,5年左右都在外包公司,2年左右在创业公司。iOS开发工程师这块,还是很少遇到30岁以上的开发,正好,来了一个30岁的开发,说实话,对我来说,还是蛮期待的,希望对我有所启示。这样的过程持续了半个小时那么年过350岁的程序员还有出路吗?作为一个8年的iOS开发,而且几...

libffi

Thisislibffi.info,由libffi.texi生产的bymakeinfo版本5.1。本手册适用于libffi,一个可移植的外国函数接口库。版权所有(C)200820102011redhat,股份有限公司。许可授予复制、分发...

C# 没落了吗?

首先,这个数字--------------------------------------------C#是否正在衰落与微软的整个平台密切相关。近年来,使用C#的人越来越少,这也是因为越来越少的人专门为Microsoft平台开发产品。现在是移动时代,微软基本上错过了互联网和移动互联网这两波浪潮。现在生活不容易。在软件工程中,人们常说“唯一不变的就是改变本身”...