• Android ANR问题定位 实战


    在Android开发过程中,ANR问题可能是非常常见的一个问题,下面我分享一个亲身经历的ANR问题以及解决方法。

    1.发生ANR 必然会有log日志,在系统的data/anr目录下, 我们将所有的anr log日志pull出来

    由于权限的原因,一般使用:

    adb pull /data/anr/anr_2022-08-04-19-43-53-830 ./
    
    • 1

    会提示:

    adb: error: failed to copy '/data/anr/anr_2022-08-04-19-43-53-830' to './/anr_2022-08-04-19-43-53-830': remote open failed: Permission denied
    
    • 1

    如果倒不出来,可以采用

    adb bugreport
    
    • 1

    执行这个命令之后会在/home/ms(这里是我的路径)生成一个zip文件: bugreport-crosshatch-SPB5.210812.002-2022-08-04-19-52-30.zip

    将这个zip解压开得到:

    在这里插入图片描述

    在/FS/data/anr 下面就是产生anr的日志文件

    在这里插入图片描述

    打开最新的一个anr日志文件,内容很多,可以通过搜索 main来快速定位到日志:

    "main" prio=5 tid=1 Native
      | group="main" sCount=1 ucsCount=0 flags=1 obj=0x71bb1108 self=0x7aaf011010
      | sysTid=11840 nice=-10 cgrp=default sched=0/0 handle=0x7be4f0a4f8
      | state=R schedstat=( 34563882813 172228872 5118 ) utm=3400 stm=55 core=6 HZ=100
      | stack=0x7fc17f0000-0x7fc17f2000 stackSize=8188KB
      | held mutexes=
      native: #00 pc 00000000005f29dc  /data/app/~~HpEMONV-UKwHtGltDb4G-w==/com.meishe.ms240sdkdemo-9NftEp5LVuvFBG2ZxJvKVQ==/lib/arm64/libNvStreamingSdkCore.so (???)
      at com.meicam.sdk.NvsTimeline.nativeApplyThemeTemplate(Native method)
      at com.meicam.sdk.NvsTimeline.applyThemeTemplate(NvsTimeline.java:1466)
      at com.czc.cutsame.CutSameEditorActivity.createTimeline(CutSameEditorActivity.java:250)
      at com.czc.cutsame.CutSameEditorActivity.initData(CutSameEditorActivity.java:118)
      at com.meishe.base.model.BaseActivity.onCreate(BaseActivity.java:48)
      at com.czc.cutsame.CutSameEditorActivity.onCreate(CutSameEditorActivity.java:95)
      at android.app.Activity.performCreate(Activity.java:8051)
      at android.app.Activity.performCreate(Activity.java:8031)
      at android.app.Instrumentation.callActivityOnCreate(Instrumentation.java:1329)
      at android.app.ActivityThread.performLaunchActivity(ActivityThread.java:3612)
      at android.app.ActivityThread.handleLaunchActivity(ActivityThread.java:3796)
      at android.app.servertransaction.LaunchActivityItem.execute(LaunchActivityItem.java:103)
      at android.app.servertransaction.TransactionExecutor.executeCallbacks(TransactionExecutor.java:135)
      at android.app.servertransaction.TransactionExecutor.execute(TransactionExecutor.java:95)
      at android.app.ActivityThread$H.handleMessage(ActivityThread.java:2214)
      at android.os.Handler.dispatchMessage(Handler.java:106)
      at android.os.Looper.loopOnce(Looper.java:201)
      at android.os.Looper.loop(Looper.java:288)
      at android.app.ActivityThread.main(ActivityThread.java:7842)
      at java.lang.reflect.Method.invoke(Native method)
      at com.android.internal.os.RuntimeInit$MethodAndArgsCaller.run(RuntimeInit.java:548)
      at com.android.internal.os.ZygoteInit.main(ZygoteInit.java:1003)
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29

    1: pid: 8625 对的上
    2: cmd line: 包名对得上 check完毕
    3: 查看UI线程,搜索main

    native: #00 pc 00000000005f29dc /data/app/~~HpEMONV-UKwHtGltDb4G-w==/com.meishe.ms240sdkdemo-9NftEp5LVuvFBG2ZxJvKVQ==/lib/arm64/libNvStreamingSdkCore.so (???)

    通过上面这个可以看出这个是一个native层的问题,给出出问题的so库的符号地址:00000000005f29dc

    2.通过aarch64-linux-android-addr2line 命令解析符号地址:00000000005f29dc

    aarch64-linux-android-addr2line 这个命令存在 /home/ms/tools/android-ndk-r21e/toolchains/aarch64-linux-android-4.9/prebuilt/linux-x86_64/bin(笔者是这个路径)

    可以将这个路径配置到环境变量,方便直接使用

    解析错误符号地址的命令:aarch64-linux-android-addr2line -C -f -e <对应带符号表的so库> <8位内存地址>

    ./aarch64-linux-android-addr2line -C -f -e '/home/ms/ftp-download/sdk/3.5.1/NvStreamingSdk_Android_3.5.1.8_20220804_102011_ARScene_MS_Symbol/NvStreamingSdk_Android_3.5.1.8_20220804_102011_Symbol/android_arm64/libNvStreamingSdkCoreSymbol.so' 0005f29dc
    
    • 1

    注意这里的so库是对应的带符号的so库才可以

    解析的结果是:

    在这里插入图片描述

    错误符号解析的结果:能定位到问题是由于CNvProjTimeline::ResetThemeTemplate() 这个方法导致的。

    这个ANR问题就定位到原因了。

    3.小技巧总结

    • “main” prio=:搜索 anr 相关信息
    • beginning of crash:搜索 crash 相关信息
    • CPU usage from:搜索 cpu 使用信息
    • 也可以通过走索这个 ----- pid 来定位ANR问题

    Cmd line:后边跟的是包名,包名能对上就能定位成功了

    ----- pid 11840 at 2022-08-04 19:43:53.853466911+0800 -----
    ...
    ...
    Total number of allocations 768630  //进程创建到现在一共创建了多少对象
    Total bytes allocated 67MB  // 进程创建到现在一共申请了多少内存
    Total bytes freed 55MB    // 进程创建到现在一共释放了多少内存
    Free memory 20MB   // 空闲内存(可用内存)
    Free memory until GC 20MB  // GC前的空闲内存
    Free memory until OOME 243MB    // OOM之前的可用内存,当这个值很小的时候,已经处于内存紧张状态,应用可能占用了过多的内存
    Total memory 32MB    // 当前总内存(已用+可用)
    Max memory 256MB     // 进程最多能申请的内存 
    
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12

    从日志里边能看到有三个线程,一个是 Signal Catcher 线程,一个是 main 线程,一个是 Jit thread pool worker thread 0,他们的线程状态分别是 Runnableblockednative 状态。

    线程的状态:

    • NEW - 创建状态
    • RUNNABLE - 就绪或运行状态
    • BLOCKED - 阻塞状态
    • WATING - 等待状态
    • TIMED_WAITING - 定时等待状态
    • TERMINATED - 终止状态

    native 状态不在类别之内,这个表示正在执行JNI函数,也是runnable状态。

    堆栈信息是我们分析ANR的第一个重要的信息,一般来说:

    • 主线程处于 BLOCK / WAITING / TIMEWAITING 状态,基本上是函数阻塞导致的 anr
    • 若主线程无异常,则应该排查 CPU 负载和内存环境等其他因素

    另外,在 anr 日志中,还有一些常见参数,他们的含义如下:

    • group:线程所处的线程组
    • sCount:线程被正常挂起的次数
    • dsCount:线程因调试而挂起次数
    • nice:线程的调度优先级
    • utm:线程在用户态中调度时间值
    • stm:线程在内核态中的调度时间值
    • core:最后执行这个线程的CPU核序号
  • 相关阅读:
    JAVA基础
    联邦学习:按混合分布划分Non-IID样本
    创建文件练习
    QT笔记——QT类反射机制简单学习
    thinkphp5 如何查询表内某个字段类型为json格式的
    SpringBoot 集成 Nacos
    米贸搜| Facebook账号类型看这一篇就足够了
    软考高级系统架构设计师系列之:可靠性设计
    【Python百日进阶-WEB开发】Day166 - Django视图 View(一)
    Python PyInstaller 打包成 Win、Mac 应用程序(app / exe)
  • 原文地址:https://blog.csdn.net/u014078003/article/details/126166934