记一次生产环境Nginx间歇性502的事故分析过程

最近我们我们在将部分业务从自有机房迁移到国内某云服务器上,在小规模上量后,发现Nginx间接性出现大量502。异常出现的特点是,一瞬间后端多个独立部署的服务全部出现502。

我们的服务架构如下:

+--------+ HTTP +-------+ HTTP +-------+
| Client | ------> | | ------> | API A |
+--------+ | | +-------+
| | HTTP +-------+
| Nginx | ------> | API B |
| | +-------+
| | HTTP +-------+
| | ------> | API C |
+-------+ +-------+

一般讲,Nginx 502就是后端处理不过来,但查看监控后端几个API的负载均很低,当前请求的QPS远远低于服务的上限。而且同一瞬间,多套独立部署的API均处理不过来的概率也比较低。

more >>

ELK实战 - 利用Nginx日志分析API耗时

本篇主要介绍如何利用ELK分析Nginx日志,统计出API的耗时数据

ELK是ElasticSearch,Logstash,Kibana的简称,但我觉得这个名字已经过时了,现在叫ELKB更合适,因为Elastic家族近期迎来了一位新成员Beats,专职做数据采集工作。

我们先来介绍下ELK的整体架构吧。

more >>

使用Git SubModule对Maven Module进行优化

这篇文章主要讲,如何将Maven Module功能与Git SubModule功能配合使用的问题。

之所以有这篇文章,是因为在使用Maven管理Java项目的过程中,当项目逐渐发展到一点规模后,我们将项目进行模块划分,将不同业务功能拆分为不同的Maven Module,模块之间有依赖关系,但可以分开部署。

但紧随而来的问题是:

  1. 当项目模块越来越多的时候,项目的编译时间越来越长
  2. 我们使用Gitlab CI做持续集成与持续交付。 Gitlab CI的持续集成与交付的是由每次Commit与每次Release Tag触发的。也就是说,每次触发CI的时候,各个模块都需要跑一边集成测试,而更麻烦的在于,无法使用Gitlab CI直接对项目进行自动部署,因为你不能每次发布的时候,都将所有的子模块都部署一遍。

more >>

Redis Cluster 初探(1) - 集群搭建与扩容

Redis Cluster是Redis官方的集群实现方案,在此之前已经有一些民间的第三方Redis集群解决方案,如Twitter的Twenproxy,豌豆荚的Codis,与其不同的是,Redis Cluster并非使用Porxy的模式来连接集群节点,而是使用无中心节点的模式来组建集群,有一定性能优势也有缺点,本文主要是我调研Redis Cluster的一些知识整理与经验汇总。

more >>

Android 封装SDK时常用的注解

工作中,我们经常需要将功能模块封装成库供合作厂商调用, 如何写好一个健壮的Android Library有很多讲究,使用注解可以对SDK暴露给开发者的接口做出一些限制,从而尽可能地避免开发者错误地使用API。 下面我们介绍几种封装SDK时常用到的注解。

more >>

MySQL解决插入emoji表情失败的问题

一直以为UTF-8是万能的字符集问题解决方案. 直到遇到这个问题.
最近在做新浪微博的爬虫, 在存库的时候, 发现只要保持emoji表情, 就回抛出以下异常

Incorrect string value: '\xF0\x90\x8D\x83\xF0\x90...'

众所周知UTF-8是3个字节, 其中已经包括我们日常能见过的绝大多数字体. 但3个字节远远不够容纳所有的文字, 所以便有了utf8mb4, utf8mb4是utf8的超集, 占4个字节, 向下兼容utf8. 我们日常用的emoji表情就是4个字节了.
所以在此我们像utf8的数据表插入数据就会报出Incorrect string value这个错误.

more >>