• 并发编程 ---为何要线程池化


    引言

    众所周知,使用线程可以极大的提高应用程序的效率和响应性,提高用户体验,但是不可以无节制的使用线程,为什么呢?

    线程的开销

    线程的开销实际上是非常大的,我们从空间开销和时间开销上分别讨论。

    线程的空间开销

    线程的空间开销来自这四个部分:

    1. 线程内核对象(Thread Kernel Object)。每个线程都会创建一个这样的对象,它主要包含线程上下文信息,在32位系统中,它所占用的内存在700字节左右。
    2. 线程环境块(Thread Environment Block)。TEB包括线程的异常处理链,32位系统中占用4KB内存。
    3. 用户模式栈(User Mode Stack),即线程栈。线程栈用于保存方法的参数、局部变量和返回值。每个线程栈占用1024KB的内存。要用完这些内存很简单,写一个不能结束的递归方法,让方法参数和返回值不停地消耗内存,很快就会发生 OutOfMemoryException
    4. 内核模式栈(Kernel Mode Stack)。当调用操作系统的内核模式函数时,系统会将函数参数从用户模式栈复制到内核模式栈。在32位系统中,内核模式栈会占用12KB内存。

    线程的时间开销

    线程的时间开销来自这三个过程:

    1. 线程创建的时候,系统相继初始化以上这些内存空间。

    2. 接着CLR会调用所有加载DLL的DLLMain方法,并传递连接标志(线程终止的时候,也会调用DLL的DLLMain方法,并传递分离标志)。

    3. 线程上下文切换。一个系统中会加载很多的进程,而一个进程又包含若干个线程。但是一个CPU内核在任何时候都只能有一个线程在执行。为了让每个线程看上去都在运行,系统会不断地切换“线程上下文”:每个线程及其短暂的执行时间片,然后就会切换到下一个线程了。

      这个线程上下文切换过程大概又分为以下5个步骤:

      • 步骤1进入内核模式。
      • 步骤2将上下文信息(主要是一些CPU寄存器信息)保存到正在执行的线程内核对象上。
      • 步骤3系统获取一个 Spinlock ,并确定下一个要执行的线程,然后释放 Spinlock 。如果下一个线程不在同一个进程内,则需要进行虚拟地址交换。
      • 步骤4从将被执行的线程内核对象上载入上下文信息。
      • 步骤5离开内核模式。

    所以,由于要进行如此多的工作,所以创建和销毁一个线程就意味着代价“昂贵”,即使现在的CPU多核多线程,如无节制的使用线程,依旧会严重影响性能。

    引入线程池

    为了免程序员无节制地使用线程,微软开发了“线程池”技术。简单来说,线程池就是替开发人员管理工作线程。当一项工作完毕时,CLR不会销毁这个线程,而是会保留这个线程一段时间,看是否有别的工作需要这个线程。至于何时销毁或新起线程,由CLR根据自身的算法来做这个决定。

    线程池技术能让我们重点关注业务的实现,而不是线程的性能测试。

    微软除实现了线程池外,还需要关注一个类型:BackgroundWorkerBackgroundWorker 是在内部使用了线程池的技术:同时,在WinForm或WPF编码中,它还给工作线程和UI线程提供了交互的能力。

    实际上, ThreadThreadPool 默认都没有提供这种交互能力,而 BackgroundWorker 却通过事件提供了这种能力。这种能力包括:报告进度、支持完成回调、取消任务、暂停任务等。

    BackgroundWorker 的简单示例如下:

    private BackgroundWorker backgroundWorker = new BackgroundWorker();
    
    private void AsyncButton_Click(object sender, RoutedEventArgs e)
    {
        //注册要执行的任务
        backgroundWorker.DoWork += BackgroundWorker_DoWork;
        //注册报告进度
        backgroundWorker.ProgressChanged += BackgroundWorker_ProgressChanged;
        //注册完成时的回调
        backgroundWorker.RunWorkerCompleted += BackgroundWorker_RunWorkerCompleted;
        //设置允许任务取消
        backgroundWorker.WorkerSupportsCancellation = true;
        //设置允许报告进度
        backgroundWorker.WorkerReportsProgress = true;
        backgroundWorker.RunWorkerAsync();
    }
    private void Cancel_Click(object sender, RoutedEventArgs e)
    {
        //取消任务
        if (backgroundWorker.IsBusy)
            backgroundWorker.CancelAsync();
    }
    private void BackgroundWorker_RunWorkerCompleted(object? sender, RunWorkerCompletedEventArgs e)
    {
        //完成时回调
        MessageBox.Show("BackgroundWorker RunWorkerCompleted");
    }
    
    private void BackgroundWorker_ProgressChanged(object? sender, ProgressChangedEventArgs e)
    {   
        //报告进度
        this.textbox.Text = e.ProgressPercentage.ToString();
    }
    
    private void BackgroundWorker_DoWork(object? sender, DoWorkEventArgs e)
    {
        BackgroundWorker? worker = sender as BackgroundWorker;
    
        if (worker != null)
        {
            for (int i = 0; i < 20; i++)
            {
                if (worker.CancellationPending)
                {
                    e.Cancel = true;
                    break;
                }
                worker.ReportProgress(i);
    
                Thread.Sleep(100);
            }
        }
    }
    

    建议使用WinForm和WPF的开发人员使用 BackgroundWorker

    Task替代ThreadPool

    ThreadPool 相对于 Thread 来说具有很多优势,但是 ThreadPool 在使用上却存在一定的不方便。比如:

    • ThreadPool 不支持线程的取消、完成、失败通知等交互性操作。
    • ThreadPool 不支持线程执行的先后次序。

    所以随着 Task 类及其所提供的异步编程模型的引入,Task相较ThreadPool具有更多的优势。大概有一下几点:

    1. Task是.NET Framework的一部分,它提供了更高级别的抽象来表示异步操作或并发任务。相比之下,ThreadPool较为底层,需要手动管理线程池和任务队列。通过使用Task,我们可以以更简洁、更可读的方式表达并发逻辑,而无需关注底层线程管理的细节。

    2. Task是基于Task Parallel Library(TPL)构建的核心组件,它提供了强大的异步编程支持。利用Task,我们能够轻松定义异步方法、等待异步操作完成以及处理任务结果。与此相反,ThreadPool主要用于执行委托或操作,缺乏直接的异步编程功能。

    3. Task在底层使用ThreadPool来执行任务,但它提供了更优秀的性能和资源管理机制。通过使用Task,我们可以利用TPL提供的任务调度器,智能化地管理线程池的大小、工作窃取算法和任务优先级。这样一来,我们能够更有效地利用系统资源,并获得更好的性能表现。

    4. Task拥有强大的任务关联和组合功能。我们可以使用Task的 ContinueWith()When()WhenAll()Wait()等方法定义任务之间的依赖关系,以及在不同任务完成后执行的操作。这种任务组合方式使并发编程更加灵活且易于管理。

    5. Task提供了更好的异常处理和取消支持机制。我们可以利用Task的异常处理机制捕获和处理任务中的异常,而不会导致整个应用程序崩溃。此外,Task还引入 CancellationToken 的概念,可用于取消任务的执行,从而更好地控制并发操作。

    所以,尽管ThreadPool在某些情况下仍然有其用途,但在C#编程中,使用Task替代ThreadPool已变为通用实践,推荐优先考虑使用Task来处理并发任务。

    参考

    编写高质量代码:改善C#程序的157个建议 / 陆敏技著.一北京:机械工业出版社,2011.9

  • 相关阅读:
    【SwiftUI模块】0032、SwiftUI搭建一个类似抖音评论模块的半页模式 - 底部抽屉
    【系统分析师之路】第十六章 复盘计算机网络(新技术领域)
    《Go语言在微服务中的崛起:为什么Go是下一个后端之星?》
    推荐两款开源的绘制流程图软件
    程序装载:“640K内存”真的不够用么?
    C的魅力在于指针
    2022-06-30 Unity核心8——模型导入
    在学习Python时遇到的一些项目bug
    【CTF机器人】文件头字节查询(Nonebot2+CQHTTP)
    【Linux系统化学习】进程的父子关系 | fork 进程
  • 原文地址:https://www.cnblogs.com/pandefu/p/17536277.html