• 并发工具类Phaser


    前言

    在面试这一篇我们介绍过CountDownLatch和CyclicBarrier,它们都是jdk1.5提供的多线程并发控制类,内部都是用AQS这个同步框架实现。
    在我们的实际项目中,有很多场景是需要从数据库查询一批数据,多线池执行某些操作,并且要统计结果,我们对这个过程做了一些封装,由于要统计结果,所以需要等所有任务都处理完成,我们用到了CountDownLatch实现同步。伪代码如下:

            ExecuteInstance ei = ExecuteInstance.build(myExecutor); //线程池
    		
            //循环
            LoopShutdown.build("myTask").loop(() -> {
    
                //不断从数据获取数据
                List list = getFromDb();
                
                //设置countdownlatch
      	    ei.setCountDownSize(list.size());
    
    	    list.forEach(item -> ei.execute(() -> {
    		//提交到线程池执行,并且统计
    	    }));
                
                //等待这一批做完
    	    ei.await();
    		
    	});
    
            //内部使用了CountDownLatch await()
    	return ei.awaitResult();
    

    代码很简单,容易理解。不过后来有同学提到每次都要setCountDownSize() + await() 这套组合太麻烦,能不能省略这两步呢。另外也不够灵活,有些场景不能提前知道要处理的数据总数,例如从迭代器遍历数据,Iterator接口并没有size方法可以获取到总数。

    那怎么实现这个功能呢?就是本篇要介绍的Phaser。

    Phaser原理

    Phaser类是jdk7提供的,可重用的,同步的,在功能上和CountDownLatch,CyclicBarrier类似,但更加灵活的类。
    "phaser" google翻译一下是:"移相器"的意思,完全不知道是什么~,不过"phase"是阶段的意思,还是能从名字了解到一些信息。

    Phaser运行机制:

    • Registration(注册)
      跟其他barrier不同,在phaser上注册的parties会随着时间的变化而变化。任务可以随时注册(使用方法register,bulkRegister注册,或者由构造器确定初始parties),并且在任何抵达点可以随意地撤销注册(方法arriveAndDeregister)。就像大多数基本的同步结构一样,注册和撤销只影响内部计数;不会创建更深的内部记录,所以任务不能查询他们是否已经注册。(不过,可以通过继承来实现类似的记录)
      可以动态的注册是它的特点之一,我们知道CountDownLatch之类的在开始就需要指定一个计数,并且不能更改,而Phaser可以开始指定,也可以运行时更改。

    • Synchronization(同步机制)
      和CyclicBarrier一样,Phaser也可以重复await。方法arriveAndAwaitAdvance的效果类似CyclicBarrier.await。phaser的每一代都有一个相关的phase number,初始值为0,当所有注册的任务都到达phaser时phase+1,到达最大值(Integer.MAX_VALUE)之后清零。使用phase number可以独立控制到达phaser和等待其他线程的动作,通过下面两种类型的方法:

      Arrival(到达机制) arrive和arriveAndDeregister方法记录到达状态。这些方法不会阻塞,但是会返回一个相关的arrival phase number;也就是说,phase number用来确定到达状态。当所有任务都到达给定phase时,可以执行一个可选的函数,这个函数通过重写onAdvance方法实现,通常可以用来控制终止状态。重写此方法类似于为CyclicBarrier提供一个barrierAction,但比它更灵活。

      Waiting(等待机制) awaitAdvance方法需要一个表示arrival phase number的参数,并且在phaser前进到与给定phase不同的phase时返回。和CyclicBarrier不同,即使等待线程已经被中断,awaitAdvance方法也会一直等待。中断状态和超时时间同样可用,但是当任务等待中断或超时后未改变phaser的状态时会遭遇异常。如果有必要,在方法forceTermination之后可以执行这些异常的相关的handler进行恢复操作,Phaser也可能被ForkJoinPool中的任务使用,这样在其他任务阻塞等待一个phase时可以保证足够的并行度来执行任务。

    • Termination(终止机制)
      可以用isTerminated方法检查phaser的终止状态。在终止时,所有同步方法立刻返回一个负值。在终止时尝试注册也没有效果。当调用onAdvance返回true时Termination被触发。当deregistration操作使已注册的parties变为0时,onAdvance的默认实现就会返回true。也可以重写onAdvance方法来定义终止动作。forceTermination方法也可以释放等待线程并且允许它们终止。

    • Tiering(分层结构)
      Phaser支持分层结构(树状构造)来减少竞争。注册了大量parties的Phaser可能会因为同步竞争消耗很高的成本, 因此可以设置一些子Phaser来共享一个通用的parent。这样的话即使每个操作消耗了更多的开销,但是会提高整体吞吐量。在一个分层结构的phaser里,子节点phaser的注册和取消注册都通过父节点管理。子节点phaser通过构造或方法register、bulkRegister进行首次注册时,在其父节点上注册。子节点phaser通过调用arriveAndDeregister进行最后一次取消注册时,也在其父节点上取消注册。
      这也是它的主要亮点之一,这一点很像ConcurrentHashMap(对HashTable)和LongAdder(对AtomicLong),通过分散热点来降低资源竞争,提升并发效率。

    • Monitoring(状态监控)
      由于同步方法可能只被已注册的parties调用,所以phaser的当前状态也可能被任何调用者监控。在任何时候,可以通过getRegisteredParties获取parties数,其中getArrivedParties方法返回已经到达当前phase的parties数。当剩余的parties(通过方法getUnarrivedParties获取)到达时,phase进入下一代。这些方法返回的值可能只表示短暂的状态,所以一般来说在同步结构里并没有啥卵用。

    CountDownLatch和CyclicBarrier都非常简单,从Phaser提供的api数量就可以看出为什么说它更加灵活,show me the code,接下来我们通过几个例子感受一下。

    Phaser例子

    例子1:子线程会等全部子线程达到后才开始执行,实现类似CyclicBarrier的效果。

    	@Test
    	public void test1() throws InterruptedException {
    		List list = Lists.newArrayList();
    		for (int i = 0; i < 10; i++) {
    			final int j = i;
    			list.add(() -> System.out.println(j));
    		}
    
    		final Phaser phaser = new Phaser(); // "1" to register self
    		// create and start threads
    		int i = 0;
    		for (final Runnable task : list) {
    			i++;
    			final int j = i;
    			phaser.register();
    			new Thread(() -> {
    				try {
    					Thread.sleep(j * 1000);
    				} catch (InterruptedException e) {
    				}
    				//全部子线程到达后才开始执行
    				phaser.arriveAndAwaitAdvance(); // await all creation
    				task.run();
    			}).start();
    		}
    		Thread.sleep(15000);
    	}
    

    例子2:task会循环做3次,通过重写onAdvance可以控制phaser结束的条件。

        	@Test
    	public void test2() throws InterruptedException {
    		//重复做3次
    		int iterations = 3;
    		List list = Lists.newArrayList();
    		for (int i = 0; i < 2; i++) {
    			final int j = i;
    			list.add(() -> System.out.println(j));
    		}
    
    		final Phaser phaser = new Phaser() {			
    			//每做一次,phase+1,该方法返回true,就会结束
    			protected boolean onAdvance(int phase, int registeredParties) {
    				return phase > iterations || registeredParties == 0;
    			}
    		};
    		phaser.register();
    		for (final Runnable task : list) {
    			phaser.register();
    			new Thread(() -> {
    				do {
    					task.run();
    					phaser.arriveAndAwaitAdvance();
    				} while (!phaser.isTerminated());
    			}).start();
    		}
    		phaser.arriveAndDeregister(); // deregister self, don't wait  
    		Thread.sleep(5000);
    	}
    

    例子3:创建多个phaser,并关联到父phaser上,就是上面提到的分层结构。

        	@Test
    	public void test3() {
    		Phaser parent = new Phaser(1);
    		Phaser phaser1 = new Phaser(parent);
    		Phaser phaser2 = new Phaser(parent);
    
    		for (int i = 0; i < 20; i++) {
    			final int j = i;
    			if (i < 10) {
    				phaser1.register();
    				new Thread(() -> {
    					try {
    						Thread.sleep(1000);
    						phaser1.arriveAndAwaitAdvance(); // await all creation
    						System.out.println(j);
    					} catch (InterruptedException e) {
    					}
    				}).start();
    			} else if (i < 20) {
    				phaser2.register();
    				new Thread(() -> {
    					try {
    						Thread.sleep(10000);
    						phaser2.arriveAndAwaitAdvance(); // await all creation
    						System.out.println(j);
    					} catch (InterruptedException e) {
    					}
    				}).start();
    			}
    		}
    		parent.arriveAndAwaitAdvance();
    		System.out.println("done");
    	}
    

    例子4:使用Phaser改写我们的代码,如下:

        	//维护一个Phaser    
    	public static ExecuteInstance buildWithPhaser(Executor executor) {
    		ExecuteInstance ei = new ExecuteInstance();
            	ei.executor = executor;
    		ei.phaser = new Phaser(1);        
    		return ei;
    	}
    
        	//提交线程池前注册一下
        	public void executeRR(Callable task, Consumer exceptionHandler, int batch) {
    		phaser.register();
    		executor.execute(() -> executeStatistics(task, exceptionHandler, batch));		
    	}
    
        	//执行后deregister一下
        	private void executeStatistics(Callable task, Consumer exceptionHandler, int batch) {
    		ReturnResult result = ReturnResult.NONE;
    		try {
            	    	//任务处理
    			result = task.call();
    		} catch (Exception e) {
    			if (statistics) {
    				counter.incrException(batch);
    			}
    			if (exceptionHandler != null) {
    				//自定义异常处理
    				try {
    					exceptionHandler.accept(e);
    				} catch (Exception he) {
    				}
    			}
    		} finally {
    			phaser.arriveAndDeregister(); //deregister   
    			if (statistics) {
    				if (ReturnResult.SUCCESS.equals(result)) {
    					counter.incrSuccess(batch);
    				} else if (ReturnResult.FAIL.equals(result)) {
    					counter.incrFail(batch);
    				} else if (ReturnResult.FILTER.equals(result)) {
    					counter.incrFilter(batch);
    				}
    			}
    		}
    	}
    
        	//等待结果
        	public ExecuteResult awaitResult() {
    		phaser.arriveAndAwaitAdvance();
    		return getExecuteResult();
        	}
    

    使用就非常简单了

    	ExecuteInstance ei = ExecuteInstance.buildWithPhaser(myExecutor); //线程池
    		
        	//循环
         	LoopShutdown.build("myTask").loop(() -> {
    
            	//不断从数据获取数据
            	List list = getFromDb();            
    
    		list.forEach(item -> ei.execute(() -> {
    			//提交到线程池执行,并且统计
    		}));        	
    	});
    
    	return ei.awaitResult();
    

    总结

    Phaser是jkd7后提供的同步工具类,它底层并没有使用AQS同步工具。相比CountDownLatch等它提供了更丰富的功能,但也意味着它更复杂,需要更多的资源,一些简单的场景CountDownLatch等工具类能满足的就使用它们即可,考虑性能,还有灵活性时才考虑使用Phaser,如笔者的场景使用Phaser就更加适合。

    更多分享,欢迎关注我的github:https://github.com/jmilktea/jtea

  • 相关阅读:
    【面经】某团面经---一篇到底
    MapReduce编程规范及示例编写
    冒泡排序
    CSS3之多列布局columns学习
    普通人想要通过互联网来赚钱,无非就是在这些平台上面来下功夫
    排序算法-希尔排序法(ShellSort)
    KASan介绍
    git dep preparation failed 报错
    大一作业HTML个人网页作业(宠物狗)
    商家中心之java商城 开源java电子商务Spring Cloud+Spring Boot+mybatis+MQ+VR全景+b2b2c
  • 原文地址:https://www.cnblogs.com/jtea/p/17622139.html