大型网站技术架构演进与性能优化(五) 五、应用程序优化:代码级优化

∥☆過路亽.° 提交于 2020-02-04 00:52:22

五、应用程序优化:代码级优化
1、优化思路
做优化首先要知道从哪里入手,也就是要知道系统的瓶颈在哪里。一个请求会消耗很多资源:CPU、内存、网络、磁盘等。这些资源中总会有一个到达瓶颈,只有优化最先到达瓶颈的资源才会产生效果。
压测工具
Java有两个经典的代码热点分析工具:JProfiler和Yourkit
Apache ab压测工具
这些具体使用参考文档。
发现瓶颈
Jstack,可以看看当前的Java线程
压测请求不是本机,要注意TCP连接数,可以使用netstat命令
检查网卡是否达到了瓶颈
I/O也可能成为瓶颈
2、影响性能的因素
所谓提升性能,通常意义上就是提升系统的QPS,即提升系统的吞吐量。
要提升系统的QPS,首先要了解QPS与RT的关系。
QPS与性能的关系
支持的线程数越多QPS越高,这只在一定范围内适用。
影响线程数量的两个主要因素是CPU数量和线程等待时间。
对于大部分的Web系统,RT(response tiime)一般由CPU执行时间和线程等待时间(远程RPC调用、I/O等待、sleep、wait等)组成。
减少CPU的执行时间对QPS有实质的提升,减少线程的等待时间对QPS提升不明显。
设置最佳线程数
所谓最佳线程数是指消耗完服务器的瓶颈资源的一个临界线程数量。
最佳线程数=[(线程等待时间+线程CPU时间)/线程CPU时间]/CPU数量。
如何才能获取最佳线程数?
第一,单用户压测,查看CPU的消耗的百分比,然后直接乘以该百分比,再进行压测。
第二,通过慢慢增加并发请求来进行性能压测,通过观察压测结果判断是否达到服务器的资源瓶颈,以获得最佳线程数量。
最佳内存设置
处理并发请求要考虑内存的设置,即每个请求需要消耗多少内存、并发请求书乘以消耗的内存就是总内存的大小,如果设置的内存小于这个数,就会导致频繁的Full GC。
如何判断是否达到内存瓶颈?压测时观察Old区内存增长是否正常。
如何计算出每个请求平均占用的内存大小呢?理论上通过Eden/(QPS * minorGC的平均间隔时间(s))来计算。
如何减少每次请求中占用的内存大小呢?
尽量减少线程请求生命周期里的对象数量。
对象创建到可回收的时间要尽可能短,例如不要在非常耗时的操作前面创建一个大对象,而尽可能在真正使用这个对象时再创建,对象使用完成后也要尽量置空。
如何提升性能
如果要提升服务器端的响应时间RT,采用减少I/O的时间能达到最佳效果,比如合并多个I/O请求。
如果要提升QPS,采用优化CPU的时间能达到最佳效果。
3、Java特性的优化
比如,常用StringBuilder、优化自定义hashCode()、equals()、toString()方法,优先使用原始数据类型,不在循环中使用try…catch,copy时使用System.arraycopy()命令。
减少编码
使用局部变量
减少方法调用
4、减少并发冲突
并发冲突往往会导致程序性能上不去,成为性能瓶颈。
容易出现并发的地方一般都会用锁,判断是否出现锁冲突要查看CPU没用满的情况下QPS是否还能上去,可以通过jstack检查线程是否都在block状态。
5、减少序列化
序列化也是Java性能的一大天敌,减少Java中的序列化操作也能大大提升性能。
序列化大部分是在RPC调用中发生的,因此避免或者减少RPC的调用就可以减少序列化,当然当前的序列化协议已经做了很多优化提升性能。
6、减少字符到字节的转换
每个字符的编码都需要查表,而这种操作非常耗CPU资源,所以减少字符到字节的转换或者相反、减少字符编码会非常有效。
读取静态文件,一般情况下,我们会把静态文件读取到内存,以减少每次从磁盘读文件的消耗,但是还可以进一步做的就是把这个静态文件直接转化成字节缓存,也就是把String经过编码转换成byte[]数组,当然我们输出的时候要用stream输出而不是用out.print()。
7、使用长连接
在内部调用中,会有一些HTTP请求,大部分情况以短连接为主。
8、总结
a、发现短板
主要考虑以下场景会受到一些限制:光速、网速、网络结构和应用本身的一些瓶颈等。
b、减少数数据大小
有两个地方特别影响性能,一是服务端在处理数据时不可避免地存在字符到字节的相互转化;而是HTTP请求时要做Gzip压缩,网络传输的耗时,这些都和数据大小密切相关。
从以下方面减少数据大小:
HTML、图片、JSON、JSON结构、Java对象、请求数。
c、数据分级
就是要保证首屏为先、重要信息未先,次要信息采用异步加载的方式,提升用户获取数据的体验。
d、减少中间环节,减少字符到字节的转换,将变的转换为不变的;增加预处理就是去掉不需要的操作。
要做好优化还需要做好应用基线,大概包括以下内容:
性能基线,何时性能突然下降;
成本基线,去年双11用了多少台机器;
链路基线,系统发生了哪些变化;
持续关注系统的性能,代码级(提升代码质量),业务(改掉不合理的调用),架构和链路级(改进架构);
用更通用和批量的方式解决问题,整合系统之间的调研链路(合并部署),提升整体机器使用率(弹性部署)。

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!