• Java线程和Go协程


    Java线程和Go协程

    Java线程和Go协程都是用于并发编程的工具,但在实现和使用上有一些不同。

    Java线程模型

    Java线程是Java语言提供的一种并发编程的机制,它允许程序在同一时间执行多个任务。Java线程是基于操作系统的线程实现的,每个线程都有自己的堆栈和程序计数器,并且可以通过调度器进行调度。Java线程可以通过继承Thread类或实现Runnable接口来创建和启动。

    两种方式启动线程:
    • 继承Thread。

    • 实现Runnable接口。

    1. class MyThread extends Thread {
    2.     public void run() {
    3.         // 线程的主要逻辑
    4.         // ...
    5.     }
    6. }
    7. public class Main {
    8.     public static void main(String[] args) {
    9.         MyThread thread = new MyThread();
    10.         thread.start(); // 启动线程
    11.     }
    12. }
    1. class MyRunnable implements Runnable {
    2.     public void run() {
    3.         // 线程的主要逻辑
    4.         // ...
    5.     }
    6. }
    7. public class Main {
    8.     public static void main(String[] args) {
    9.         MyRunnable myRunnable = new MyRunnable();
    10.         Thread thread = new Thread(myRunnable);
    11.         thread.start(); // 启动线程
    12.     }
    13. }

    Java同步机制
    1. synchronized关键字: Java提供了synchronized关键字来控制对共享资源的并发访问,确保线程安全。

    2. ReentrantLock: ReentrantLock是一种基于AQS框架的可重入互斥锁,提供了比synchronized更多的功能。

    AQS原理参考之前文章:《Java AQS实现》


    Java并发实现是基于操作系统调度的,即程序负责创建线程,操作系统负责调度。

    这种方式有两大不足:

    1. 复杂性:

      • 创建容易、退出难。

      • 需要父线程去通知并等待子线程退出(join)。

      • 并发单元间通信困难:涉及到共享内存,就会用到锁,容易出现死锁。

      • 线程栈大小的设置。

    2. 扩展性:

      • 不能创建大量线程,因为每个线程占用的资源不小,操作系统调度切换线程的代价也不小。

      • 对于很多网络服务程序,由于不能大量创建线程,就要在少量线程里做网络的多路复用,即使用epoll/kqueue。

    Go协程模型

    Go协程是Go语言提供的一种轻量级的并发编程机制。

    Go协程是由Go语言运行时环境管理的,它可以在同一个线程上运行多个协程。Go协程使用关键字"go"来创建,可以通过go关键字将一个函数调用转换为一个协程。Go协程之间通过通道(channel)进行通信,以实现数据的传递和同步。

    Go中启动协程:
    1. func main() {
    2.  // 启动一个协程
    3.  go sayHello("Hello from Goroutine 1")
    4. }

    Go同步机制:
    • Channel: Channel是Go中用于协程间通信和同步的主要机制。

    • Mutex: Mutex用于控制共享资源的访问,保证数据的完整性和一致性。

    Go始终推荐以CSP(通信进程顺序)模型风格构建并发程序,也就是使用channel。channel实现了CSP模型中的输入/输出原语。

    Mutex示例:

    1. var (
    2.  counter = 0
    3.  mutex   sync.Mutex
    4. )
    5. func incrementCounter(wg *sync.WaitGroup) {
    6.  defer wg.Done()
    7.  // 加锁
    8.  mutex.Lock()
    9.  defer mutex.Unlock()
    10.  // 访问共享变量
    11.  counter++
    12.  fmt.Printf("Counter: %d\n", counter)
    13. }
    14. func main() {
    15.  var wg sync.WaitGroup
    16.  for i := 0; i < 5; i++ {
    17.   wg.Add(1)
    18.   go incrementCounter(&wg)
    19.  }
    20.  // 等待所有 Goroutines 完成
    21.  wg.Wait()
    22. }

    Channel示例:

    1. var (
    2.  counter = 0
    3. )
    4. func incrementCounter(wg *sync.WaitGroup, ch chan bool) {
    5.  defer wg.Done()
    6.  // 发送消息通知其他 Goroutine 进行更新
    7.  ch <true
    8.  // 访问共享变量
    9.  counter++
    10.  fmt.Printf("Counter: %d\n", counter)
    11.  // 发送消息通知完成
    12.  <-ch
    13. }
    14. func main() {
    15.  var wg sync.WaitGroup
    16.  ch := make(chan bool, 1)
    17.  for i := 0; i < 5; i++ {
    18.   wg.Add(1)
    19.   go incrementCounter(&wg, ch)
    20.  }
    21.  // 等待所有 Goroutines 完成
    22.  wg.Wait()
    23.  // 关闭通道
    24.  close(ch)
    25. }

    Goroutine调度器 GPM 模型:
    • G(Goroutine):协程(轻量级线程)。存储了 goroutine 的执行栈信息、goroutine状态及goroutine的任务函数等。

    • P(Processor):包含了运行 goroutine 的资源,如果线程想运行 goroutine,必须先获取P,P中还包含了可运行的G队列。

    • M(Thread):代表真正的执行计算资源。从P的本地队列中获取G,切换到G的执行栈上并执行G的函数。

    在go中,线程 M 是运行 goroutine 的实体,调度器 P 的功能是把可运行的 goroutine 分配到工作线程上。

    主要流程:

    1. go func来创建一个goroutine。

    2. 有两个存储G的队列,一个是局部调度器P的本地队列,一个是全局队列。先创建的G会先保存在P的本地队列,本地满了后会保存在全局队列中。

    3. G只能运行在M中,一个M必须持有一个P,M和P是1:1的关系。M会从P的本地队列弹出一个可执行状态的G来执行,如果P的本地队列为空,就会从其它线程的P队列中偷取G执行。

    4. 当M执行某一个G时发生了syscall或者阻塞操作,M会阻塞,如果当前有一些G在执行,runtime会把这个线程M从P中摘除,然后再创建一个新的操作系统的线程(如果有空闲的线程可用就复用空闲线程)来服务于这个P。

    5. 当M系统调用结束时候,这个G会尝试获取一个空闲的P执行,并放入到这个P的本地队列。如果获取不到P,那么这个线程M变成休眠状态,加入到空闲线程中,然后这个G会被放入全局队列中。

    Go协程调度策略

    源码:go1.20/src/runtime/proc.go

    1. //找到一个可运行的协程以执行
    2. func findRunnable() (gp *g, inheritTime, tryWakeP bool) {
    3.  // 偶尔从全局队列拿取协程保证公平性
    4.  if pp.schedtick%61 == 0 && sched.runqsize > 0 {
    5.   ...
    6.  }
    7.  // 本地队列获取协程
    8.  if gp, inheritTime := runqget(pp); gp != nil {
    9.   return gp, inheritTime, false
    10.  }
    11.  // 全局队列获取协程
    12.  if sched.runqsize != 0 {
    13.   ...
    14.  }
    15.  // 从网络轮询队列中获取事件
    16.  //当一个goroutine(G、协程)在等待网络响应或某种I/O操作时,它会被阻塞,此时不会影响P队列中的其它G执行。
    17.  //阻塞的goroutine等待网络响应数据到达后,G1会被从新放入P的本地队列,本地队列满了会被放入全局队列等待调度。
    18.  //如果G被阻塞在某个channel操作或者网络I/O操作上,那么G会被放置到某个等待队列中,而M会尝试运行P的下一个可运行的G、
    19.  if netpollinited() && netpollWaiters.Load() > 0 && sched.lastpoll.Load() != 0 {
    20.   ...
    21.  }
    22.  // 从其它P中窃取一半的任务,窃取个数n = x - x / 2。假如x有3个元素,则窃取2
    23.  if mp.spinning || 2*sched.nmspinning.Load() < gomaxprocs-sched.npidle.Load() {
    24.   ...
    25.  }
    26. }

    按如下顺序调度获取协程执行:

    1. 1/61的概率从全局队列取协程;

    2. 从本地队列获取协程;

    3. 从全局队列获取协程;

    4. 从网络轮询队列中获取协程事件;

    5. 从其它P队列中窃取协程。


    阻塞调度:
    • 网络I/O阻塞:
      当一个 goroutine 在等待网络响应或某种I/O操作时,它会被阻塞,此时G会被放置到某个等待队列中,而M会尝试运行P的下一个可运行G。也就是说P中其它的G仍然可以并发执行。

      待阻塞的goroutine等待网络响应数据到达后,G会被重新放入P的本地队列,本地队列满了会被放入全局队列等待调度。

    • 系统调用阻塞:
      当一个G被阻塞在系统调用上,那么G会阻塞,执行该G的M也会解绑P,与G一起进行入阻塞状态。此时有空闲的M,则与P绑定并执行P中其它的G,没有空闲的M则创建新的M绑定P并执行。

      当系统调用返回后,阻塞的G会尝试获取一个可用的P,有可用的P则将之前运行G的M与P绑定继续运行G。没有可用的P则G与M的关联解除,并将G放入全局队列等待调度。


    窃取:

    从其它P中窃取一半的任务,窃取个数n = x - x / 2。假如x有3个元素,则窃取2个。

    Go 中协程窃取机制和 Java 并行流中窃取任务机制思想一致,都是从其它队列偷取任务,放到自个队列中执行。

    Java并行流任务窃取可见《ForkJoinPool源码解析》

    总结

    Java中需要手动管理线程的生命周期和同步机制。为了复用线程,还需要创建线程池来达到线程的复用,此时线程池的参数也需要用户自己调试。

    而在Go中是由Go 语言自动管理协程的生命周期和调度。此外,Go协程的通信机制更加灵活,可以通过通道实现协程之间的数据传递和同步。

    参考资料

    1. 《Go语言精进之路》。

  • 相关阅读:
    3. 递归
    OpenGL3.3_C++_Windows(9)
    【零基础学Python】后端开发篇 第二十一节--Python Web开发二:Django的安装和运行
    锁与事务同时使用
    【附源码】计算机毕业设计java租车信息管理系统设计与实现
    cloud探索 - AWS容器
    JavaScript - canvas - 选择部分区域的图像数据
    java毕业设计独龙族民族特色服务网站Mybatis+系统+数据库+调试部署
    22 河南省赛 - H.旋转水管(暴搜)
    使用 Messenger 跨进程通信
  • 原文地址:https://blog.csdn.net/u011385940/article/details/132719377