码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • QEMU热迁移中的VHOST-USER-NVME连接问题


    之前耗了一段时间做SPDK下的vhost-user-nvme的开发,就是让VM内使用NVME存储。涉及到vhost-user-nvme设备的QEMU live迁移或者热升级的开发,碰到一个有意思的问题,值得写一下。

    QEMU版本:https://github.com/spdk/qemu.git 最好用https://review.gerrithub.io/#/c/spdk/qemu/+/406011/

    SPDK版本:https://github.com/spdk/spdk

    现象:大约QEMU迁移1000次左右时,SPDK拉起的vhost进程就会因段错误crash掉。

    直接原因就出在spdk_vhost_nvme_admin_passthrough函数下的SPDK_NVME_OPC_ABORT过程,当qemu下发NVME命令给vhost时,发生了段错误

    case SPDK_NVME_OPC_DOORBELL_BUFFER_CONFIG:
        ret = vhost_nvme_doorbell_buffer_config(nvme, req, cpl);
        break;
    case SPDK_NVME_OPC_ABORT:
        //出问题的代码在此处
        sq_tail = nvme->dbbuf_dbs[sq_offset(1, 1)] & 0xffffu;
        cq_head = nvme->dbbuf_dbs[cq_offset(1, 1)] & 0xffffu;
        SPDK_NOTICELOG("ABORT: CID %u, SQ_TAIL %u, CQ_HEAD %u\n", (req->cdw10 >> 16) & 0xffffu, sq_tail, cq_head);

    很明显,dbbuf_dbs此时已经为空,仔细翻看一下代码就清楚了,只有destroy_device_poller_cb执行后才会释放dbbuf_dbs。spdk_vhost_nvme_stop_device会调用destroy_device_poller_cb,spdk_vhost_nvme_stop_device则是spdk_vhost_nvme_device_backend结构中stop_device的定义:

    static const struct spdk_vhost_dev_backend spdk_vhost_nvme_device_backend = {
    .start_device = spdk_vhost_nvme_start_device,
    .stop_device = spdk_vhost_nvme_stop_device,
    .dump_info_json = spdk_vhost_nvme_dump_info_json,
    .write_config_json = spdk_vhost_nvme_write_config_json,
    .remove_device = spdk_vhost_nvme_dev_remove,
    };

    在往上走就是stop_device,即spdk_vhost_event_send(vdev, vdev->backend->stop_device, 3, "stop device"),stop_device同样是另外一个结构体内的函数定义

    const struct vhost_device_ops g_spdk_vhost_ops = {
    .new_device = start_device,
    
  • 相关阅读:
    微信小程序——生命周期详解(代码解读)
    我的创作纪念日
    蜂窝基站和信号放大器的区别介绍
    03-React事件处理 & 生命周期 & Diffing算法
    uniapp 重写自带的返回事件
    Spring系列16:ApplicationContext扩展国际化
    基于压电陶瓷传感器的智能枕头非侵入式生命体征监测
    算法设计(一) : 搜索算法实现八皇后问题
    SpringBoot 自动装配原理
    Elasticsearch:Lucene 中引入标量量化
  • 原文地址:https://blog.csdn.net/lingshengxiyou/article/details/127791897
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号