• 你觉得好的代码可能并不是最优的解决方案


    晚上我看到了JeffXie 写了一篇关于内存屏障的文章,后面又看到Linus对一次内存屏障修改的建议,所以就有了这篇文章。

    https://mp.weixin.qq.com/s/H7Pw8xCKcNu41UGaYB648w

    在我看来,内存屏障谁为了让计算机做更加正确的事情,不希望计算机对计算进行排序导致结果不符合预期。

    1189418272966bfc605ec1eacb345421.png

    因为是多核计算机,所以会对上面的计算进行指令排序,说指令排序可能觉得拗口,可以认为多核计算的顺序是随机的,随机的执行就会导致随机的结果。

    随机的执行结果肯定不符合我们的预期。

    —— 所以就出现了内存屏障

    内存屏障如果理解简单一些,可以认为是写优先,读次之,因为是对同一片内存「同一个变量」操作。

    加了内存屏障的标志,多个cpu之间互相可见,比如cpu1要对变量a操作,如果加了内存屏障其他cpu也会看到cpu1的这个执行指令,就会先等cpu1完成后再去读。

    f0a2645efa77cd57ada643b032fdfcba.png

    最近的一个关于内存屏障的提交,被Linus驳回重写

    提交的理由和代码修改如下

    Mikulas是这部分的代码的修改提交,他首先提出了自己的疑问,在wait_on_bit这个函数里面加上内存屏障是否合适?

    他觉得应该加上内存屏障的原因是因为这个函数在其他地方要调用,在一些weak memory ordering架构上,这个函数有可能返回无效的值。

    关于weak memory ordering 我认为是对指令的一种排序,如果在排序不恰当的架构上,就有可能引起问题。

    之后就是

    ed0a51af11cbfc6fdd353613a87b084a.png

    之后就是Linus的建议

    首先这是一个基础的接口函数,这个问题在x86上是没有问题的。

    之后又说明了内存屏障是不能轻易使用的,要正确的使用它,你为什么还视图提交这方面的comments。

    b05ca5cd08467da1dae08464dbc59949.png

    其中提到的修改建议最后被使用在最新的内核代码中,就是重新写一个test_bit_acquire()函数。

    而新的函数里面有一个函数是 smp_load_acquire(),这个函数我查了很多资料,最后我自己的理解是,获取这个地址是否有在被其他cpu写,如果没有,就表示当前的cpu可以使用这个地址的值。

    可以认为是内存屏障更加精细的函数操作。

    9d899883b9e9538c916b0f256a0ee3cc.png

    ——最后的修改如下

    c3f98287ec7a309e921990d867279654.png

    695feb17b2aa6cb94c171f36aed19919.png

    关于如何正确只用内存屏障,下面的文章会非常适合大家

    https://mp.weixin.qq.com/s/d8UwmHzTxKICN3HvGnbdHQ

    参考:

    https://lkml.org/lkml/2022/8/25/1225

    https://www.kernel.org/doc/Documentation/memory-barriers.txt

    http://vh21.github.io/linux/2015/04/25/linux-barrier-api.html

    63aa2939ccdc7ed2cc0b7c66f1d65056.jpeg

    56831ed2c1e57eddc67b62dc634c95aa.gif

  • 相关阅读:
    Java --- SpringMVC的RESTFul风格
    一种基于非线性惯性权重的海鸥优化算法-附代码
    AnaConda安装过程
    如何使用evilscan 扫描网络
    图形库篇 | EasyX | 基本介绍
    什么是 JVM ?
    LVS(Linux Virtual Server)集群,(1)NAT模式
    模拟实现string类
    数据驱动智能制造业务转型与创新
    一分钟理解npm run dev 和 npm run serve
  • 原文地址:https://blog.csdn.net/weiqifa0/article/details/126576743