浙江省快乐12走势图表

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 142|回复: 0
打印 上一主题 下一主题

浙江体彩11选五遗漏: 线上PHP问题排查思路与实践

[复制链接]
跳转到指定楼层
楼主
发表于 2018-11-16 09:42:19 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
常见问题

不合用户看到的毛病可能不一样。一般用户看到的毛病都是表层的现象。如,裸奔的毛病页面:









这种裸奔的毛病页面,经常被用户成为乱码,太丑太暴漏。甚至把一些不该该暴漏的敏感信息都暴漏了。如,nginx版本号,文件路径等。为了解决这些问题,设计师们又做了有情调的毛病页??墒?,毛病五花八门,其实不是一个毛病页能掩盖的。

对工程师,咱们看问题可能会更深入些。能看到问题背后的问题。如,看到502毛病,他们会想到可能是后端PHP-FPM进程呈现问题。如后真个PHP-FPM进程已经死失落,nginx无法连接到PHP-FPM进程。

措置思路









虽然问题五发八门,可是有一套解决思路可以整体措置这些问题。解决思路大体分为如下几个部分:恢复办事,保存现场,排盘问题和验证。下面对这几部划分手加以说明。

恢复办事









恢复办事,顾名思义。就是从速让用户感触感染不到毛病的存在。为什么这样做呢?原因有如下两个。第一,如果不这样做,用户看到的是毛病页面,用户体验欠好??赡芑够岫怨敬粗苯拥木盟鹗?。 第二,如果不这样做,年底你的奖金就飞了。那如何恢复办事呢?下面说下不合场景下的几种操作体例。

摘机:所谓摘机就是摘除有问题的机器。这种操作的应用场景是,当提供办事的多台机器中,有部分机器呈现问题时,可以这样操作。这就要求我们,对线上运行的办事,必须保障有多台机器运行相同的办事,多台机器间没有依赖关系。其中一台或者几台被摘除不会影响到其他机器。

回滚:所谓回滚就是恢复到操作之前的状态。这种操作的应用场景是,当进行了上线或者软件配置修改后,呈现了问题。

重启:当你的办事运行一段时间,突然呈现了异常。如进程占用了cpu 100%。你可以通过重启的体例来解决。重启的过程就是一个资源释放和重新分派的过程。

降级:当你的网站的拜候量超出了你办事器的负载时,网站就会呈现问题。这个时候,就需要包管主要功能可用。把损失降到最低。

固然,网站呈现问题时,其实不是教条的套用,做单一的操作来恢复办事。而是根据情况进行相应的操作。遇到问题时,可能需要进行多个恢复办事的操作??墒?,所有的这些操作的原则就是,把损失降到最低。

保存现场









其实问题排查和警察破案过程是一样的。想想警察是如何保存现场的?商场内安装摄像头。不便利安装摄像头的场合(洗头房),就在场合外的大街上安装摄像头。虽然有监控,可是还有会有案件产生。案件呈现后,他们会呵护案发现场。其实我们对现场的保存,也是从这几方面入手。

系统内部日志:这就好比在商场内安装摄像头。如果有良好的日志记录,那就可以记录系统运行过程中呈现的一些异常。良好的日志系统,也是我们在选择开源软件时的重要标准。

系统外部监控:这个就好比洗头房外大街上的监控。在系统中,总有一些处所是你不便利或者没权增加日志记录的。如,咱们在挪用第三方办事的时候,肯定你也不便利在第三方办事中添加日志。这个时候,我们就需要增加对第三方办事的监控和日志记录。能时刻知道第三方办事是否可用。

保存运行状态:这个就是案发现场的保存。好比,你发现一个进程占用cpu 100%。你为了解决问题,贸然的重启进程,就是破坏了现场。

保存现场和恢复办事并没有一个明确的先后关系。他们共同是问题排查的基础?;指戳税焓?,你才可用安心的进行问题排查。保存了现场,你才有问题排查的数据来源。有时候,保存现场和恢复办事会有冲突。如,你就一台机器提供办事,这台机器上呈现了问题,这个时候要如何措置呢?这个时候建议最短的时间备份现场,然后尽快的恢复办事。如,一个进程占用cpu 100%,那你就可以用 gcore 把进程生成core文件,然后重启进程。

对PHP开发的系统,为了实现更健壮的日志系统,我这里有个小tip??梢允褂胷egister_shutdown_function 和 error_get_last。具体的可以查看。博文地址

所有的这些保存现场的操作,就是为之后的问题排查提供数据。

排盘问题

排盘问题的过程才是展现你福尔摩斯风度的时候。问题排查的过程就是用你掌握的知识和工具去阐发数据的过程。现在,数据已经有了。知识和工具都需要掌握哪些呢?

知识

知识的海洋是浩瀚的。这里我只能做个大体的分类。

语言:PHP语言方面,除了解基本语法以外,还要对PHP的内核有所了解。对PHP内核有所了解后,你就大体了解了php的执行流程。呈现问题,你就可以大体推测是那个环节呈现了问题。发现问题后,你可以根据掌握的知识阐发出大体那里呈现了问题。好比,当一个PHP进程占用cpu 100%。你就可以通过掌握的PHP内核的数据结构找出是大体那里的代码呈现了问题。拜见博文《当cpu飙升时,找出php中可能有问题的代码行》

网络:咱们究竟结果是弄网络通信编程的。对网络通信方面的知识有所了解,是必须的。尤其是对一些协议要有大体的了解。通信协议的重要性,其实不但仅局限于面试时撑撑排场,更重要的是用来解决问题。查看博文 《tcpdump 和 wireshark组合拳,揪出有问题的机器》

软件:对搭建系统所使用软件要有所了解。如对memcached的内存管理策略有所了解的话,可以让你更好的对其调优,充分的利用内存,减少内存浪费。

系统:避免咱们搭建的系统运行在操作系统上。那就需要对操作系统所有了解。如,权限,系统日志位置,oom等。

工具

工欲善其事必先利其器。网络上有一张图总结的很好,把经常使用的工具总结的很全。









如果你把所有的工具都能很好的掌握,你就是神啦。

案例阐发

案例阐发中给出了三个案例。涉及网络,语言和系统三个方面。

网络:使用tcpdump排查mysql数据库tps飙升的问题

语言:php进程致使办事器cpu 100问题追查过程

系统:一个echo引起的进程解体

更多内容回复查看:
游客,如果您要查看本帖隐藏内容请回复
C VC C++ MFC 汇编 函数 脚本 辅助 多开 注入 内存 插件 破解 基址 窗口 大漠 绑定 编程 交流 论坛 实例 源码
*滑动验证:
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

VC中文网 - 豫ICP备14012807号|小黑屋|联系客服|金币冲值|浙江省快乐12走势图表

GMT+8, 2018-12-17 11:56 , Processed in 0.093749 second(s), 29 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 浙江省快乐12走势图表 返回列表