• Java使用多线程做批处理(查询大量数据)


    Java使用多线程做批处理(查询大量数据)

    前言背景

    什么是进程
    “进程”是操作系统的概念,一个独立运行的程序,就是一个“进程”。
    什么是线程
    “线程”是由“进程创建”的,一个进程可以创建任意多的线程,每个线程都包含一些代码。线程中的代码会同主进程或者其他线程“同时运行”。

    什么是多进程
    同一时间段,同时运行多个程序。
    什么是多线程
    一个程序同时启动多个线程,也就是多个代码块同时运行。从而提高程序的运行效率。

    二、并发和并行
    什么是并发
    多个线程同时访问同一资源
    例:你正在吃饭,有人来敲门,你放下饭碗去开门,回来接着吃饭。

    什么是并行
    多个线程同时开始运行
    例:你正在吃饭,来电话啦,你边吃饭边打电话

    Java使用多线程的条件

    批处理(批量上传,批量导出,批量更新)

    查询大量数据

    本文以查询为例,展示一下线程池的使用。

    本文使用的多线程框架是Executor

    Executor 框架是 Java5 之后引进的,在 Java5 之后,通过Executor来启动线程比使用 Thread 的start方法更好

    详情可以参考博客

    https://else.wiki/post/JavaThreadPool

    操作流程

    • 查询出表的数据总量。
    • 数据的切分,根据本机CPU的核数配置合适数量的线程处理数,根据数据总量为不同的线程分配不同的查询数据量分段,即不同的线程查询不同分段的数据。
    • 将各个查询数据的线程提交至线程池,这里使用的线程是带有返回结果的异步线程。(这样能把所有查询结果合并,才能进行下一步的操作。拿不到处理后的数据还怎么做下一步操作呢,所以一点要选择带有返回结果的线程)

    为了例子足够简单,这里的数据总量直接写死,不去查询对应的数据库,我们的关注点放在,如何使用多线程以及多线程查询的结果合并,查询的表如下图,有1条数据,分成4个线程,每一个线程查询1条数据返回,最后把多个线程查询的数据合并

    image-20220827111155997

    controller层

    @Resource
    private IBlogService blogService;@GetMapping("/testThredData")
    public List testThredData(){
       
    	return blogService.getAllResult();
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6

    service层

    public interface IBlogService extends IService<Blog> {
       
        //每个线程分页查询
        public List<Blog> getQueryData(Integer start,Integer end);
        //合并线程结果
        public List getAllResult();
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7

    serviceImpl层

    @Service
    public class BlogServiceImpl extends ServiceImpl<BlogMapper, Blog> implements IBlogService {
       
        @Resource
        private BlogMapper blogMapper;
        @Autowired
        private MultiThreadQueryUtil multiThreadQueryUtil;
         //每个线程分页查询
        @Override
        public List<Blog> getQueryData(Integer start, Integer end) 
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
  • 相关阅读:
    淘宝/天猫按关键字搜索淘宝商品 API 返回值说明
    redis的使用
    数据库系统原理与应用教程(044)—— MySQL 查询(六):使用 LIMIT 选项实现分页查询
    GZ038 物联网应用开发赛题第2套
    openpnp - 74路西门子飞达控制板(主控板STM32_NUCLEO-144) - 验证
    「Cpolar」内网穿透实现在外远程连接MongoDB数据库【端口映射】
    js使用canvas实现图片鼠标滚轮放大缩小拖拽预览,显示像素坐标,显示像素值
    Linux下PostgreSQL安装部署详细步骤
    Nginx查找耗时的接口
    vue视频播放功能
  • 原文地址:https://blog.csdn.net/m0_61820867/article/details/126556143