• JVM下篇(一、性能监控与调优-概述篇)


    JVM_性能监控与调优-概述篇

    提示: 本材料只做个人学习参考,不作为系统的学习流程,请注意识别!!!



    一. 性能监控与调优-概述篇

    1. 大厂面试题

    • 支付宝:

    支付宝三面:JVM性能调优都做了什么?

    • 小米:

    有做过JVM内存优化吗?
    从SQL、JVM、架构、数据库四个方面讲讲优化思路

    • 蚂蚁金服:

    JVM的编译优化
    JVM性能调优都做了什么
    JVM诊断调优工具用过哪些?
    二面:JVM怎样调优,堆内存、栈空间设置多少合适
    三面:JVM相关的分析工具使用过的有哪些?具体的性能调优步骤如何

    • 阿里:

    如何进行JVM调优?有哪些方法?
    如何理解内存泄漏问题?有哪些情况会导致内存泄漏?如何解决?

    • 字节跳动:

    三面:JVM如何调优、 参数怎么调?

    • 拼多多:

    从SOL、 JVM、 架构、数据库四个方面讲讲优化思路

    • 京东:

    JVM诊断调优工具用过哪些?
    每秒几十万并发的秒杀系统为什么会频繁发生GC?
    日均百万级交易系统如何优化JVM?
    线上生产系统OOM如何监控及定位与解决?
    高并发系统如何基于G1垃圾回收器优化性能?

    2. 背景说明

    1. 生产环境中的问题
    • 生产环境发生了内存溢出该如何处理?
    • 生产环境应该给服务器分配多少内存合适?
    • 如何对垃圾回收器的性能进行优化?
    • 生产环境CPU负载飙高该如何处理?
    • 生产环境应该给应用分配多少线程合适?
    • 不加log,如何确定请求是否执行了某一行代码?
    • 不加log,如何实时查看某个方法的入参和返回值?
    1. 为什么要调优
    • 防止出现OOM
    • 解决OOM
    • 减少Full GC出现的概率
    1. 不同阶段的考虑
    • 上线前
    • 项目运行阶段
    • 线上出现OOM

    3. 调优概述

    1. 监控的依据
    • 运行日志
    • 异常堆栈
    • GC日志
    • 线程快照
    • 堆转储快照
    1. 调优的大方向
    • 合理的编写代码
    • 充分并合理的使用硬件资源
    • 合理的进行JVM调优

    4. 性能调优的步骤

    4.1 发现问题:性能监控

    一种以非强行或者入侵方式收集或查看应用运行性能数据的活动。

    监控通常是指一种在生产、质量评估或者开发环境下实施的带有预防或主动性的活动。

    当应用相关人员提出性能问题却没有提供足够多的线索时,首先我们需要进行性能监控,随后是性能分析。

    监控指标:

    • GC频繁
    • CPU load过高
    • OOM
    • 内存泄露
    • 死锁
    • 程序响应时间较长等。

    4.2 排查问题:性能分析

    一种以侵入方式收集运行性能数据的活动,它会影响应用的吞吐量或响应性。

    性能分析是针对性能问题的答复结果,关注的范国通常比性能监控更加集中。

    性能分析很少在生产环境下进行,通常是在质量评估、系统测试或者开发环境下进行,是性能监控之后的步骤。

    分析手段:

    • 打印GC日志,通过GCviewer或者http://gceasy.io来分析日志信息
    • 灵活运用命令行工具如:jstack、jmap、jinfo等
    • dump出堆文件,使用内存分析工具分析文件
    • 使用阿里的Arthas,或者jconsole、JVisualVM来实时查看JVM状态
    • jstack查看堆栈信息

    4.3 解决问题:性能调优

    一种为改善应用响应性或吞吐量而更改参数、源代码、属性配置的活动,性能调优是在性能监控、性能分析之后的活动。

    调优方案:

    • 适当增加内存,根据业务背景选择垃圾回收器
    • 优化代码,控制内存使用
    • 增加机器,分散节点压力
    • 合理设置线程池线程数量
    • 使用中间件提高程序效率,比如缓存、消息队列等

    5. 性能评价/测试指标

    1. 停顿时间(响应时间)

    提交请求和返回该请求之间使用的时间,一般比较关注平均响应时间,在垃圾回收环节中,暂停时间指:执行垃圾收集时,程序在工作线程被暂停的时间。

    1. 吞吐量

    对单位时间内完成的工作量(请求)的度量。在GC中,运行用户代码的时间占总运行时间的比例(总运行时间=程序的运行时间+内存回收的时间)。吞吐量=1-1/(1+n)。-XX:GCTimeRatio=n

    1. 并发数

    同一时刻对服务器有实际交互的请求数

    1. 内存占用

    Java堆取所占的内存大小

    1. 相互间的关系

    以高速公路为例:

    • 吞吐量:每天通过高速公路收费站的车辆数据(或收费站每天收取的高速费)

    • 并发数:

    • 响应时间:车速

    理解:如果高速上正在行驶的车辆数目较小(并发数较小),此时车速较快(响应时间快),收费站每天收取的高速费较少(吞吐量较小)。随着高速上正在行驶的车辆的数目变大(并发数变大),此时车速稍微可能下降(响应时间稍微下降),此时收费站每天收取的高速费变大(吞吐量变大)。随着高速上正在行驶的车辆的数目持续增大(并发数持续增大),导致堵车,车速会下降(响应时间下降),此时收费站每天收取的高速费反而降低(吞吐量变小)。

  • 相关阅读:
    【学习笔记】无线通信与安全
    【数据库】Mybatis底层原理
    Python中进行特征重要性分析的9个常用方法
    MySQL--主从复制和读写分离
    摄像头V4L2获取的YUY2格式转YUV420格式
    计算机毕业设计(附源码)python智慧消防维保系统后端
    7.JSP
    C语言描述数据结构 —— 二叉树(2)Top-K问题
    zookeeper应用之leader选举
    绘制散点图、曲线图、折线图和环形图失败, 设置迭代次数和进度无法保存图片
  • 原文地址:https://blog.csdn.net/weixin_43695916/article/details/127086525