多线程案例-线程池

你的名字 2023-10-10 16:01 167阅读 0赞

2d8b044c9aa74626af93f6da7df31ef7.png

1.什么是线程池

线程存在的意义是当使用进程进行并发编程太重了,此时引入了一个”轻量级的”进程-线程.

创建线程比创建进程更高效,销毁线程比销毁进程更高效,调度线程比调度进程更高效..此时我们就用多线程来代替进程进行并发编程了,但是随着对性能的要求的提高,线程相对来说又变”重”了,在我们频繁创建和销毁线程是,也有很大的开销

因此我们为了进一步提高效率,提出了两种办法

第一种:类似于进程和线程,我们创建一个”轻量级线程”-协程/纤程(这种方法还没有加入到java标准库中)

第二种:使用线程池,来降低创建/销毁线程带来的开销

线程池就是和字符串常量池,数据库连接池相同的道理,事先把需要用的线程创建好,放到线程池中,后面需要使用的时候,直接从池中获取,如果用完了,就还给线程池..这两个操作是比创建线程/销毁线程要更加高效的!!

线程池的好处:减少每次启动,销毁线程的损耗

创建线程/销毁线程是交由操作系统内核完成的,从线程池获取/交还是由用户代码能实现的,不必交给操作系统内核

相比于操作系统内核来说,用户态程序的执行更为可控,想要执行某个任务(从线程池取线程,还线程)会很快的就完成了,如果通过操作系统内核创建线程,销毁线程,需要通过系统调用,让内核来执行,但是内核身上背负的是整个计算机的活动,服务的是所有应用程序,整体过程是”不可控的”,因此使用线程池更为高效!

2.标准库中的线程池

在Java标准库中也提供了线程池可以直接使用

标准库中提供了很多种创建线程池的方式,这里提供一种简单的方式创建线程池

b69808a62a3b4606bd73f541ee7eabf6.png

线程池里的线程数目是十个

我们在上述代码中并没看见new关键字,此处的new是方法名字的new,不是关键字

这里相当于直接使用类的静态方法创建出的对象,相当于把new操作给隐藏到这样的方法后面了.这种方法就成为”工厂方法”,提供这个方法的类,称为”工厂类”,此处这个代码使用的是”工厂设计模式”,下来我们了解一下什么是”工厂模式”

工厂模式

工厂模式:使用普通的方法来代替构造方法,创建对象(构造方法只能构造一种对象,如果要构造不同情况的对象,就很难了)

举个例子:我们要使用xy直角坐标系和ra极坐标系确定一个点时,要创造两种不同的对象

  1. class Point{
  2. public Point(double x,double y) {
  3. }
  4. public Point(double r,double a) {
  5. }
  6. }

很明显这个代码是有问题的,编译器报错,正常来说,多个构造方法是”重载”的方式来提供的,重载要求:方法名相同,参数的个数或者类型不相同,为了解决这个问题,可以使用工厂模式

  1. class Point{
  2. public static Point makePointByXY(double x,double y) {
  3. }
  4. public static Point makePointByRA(double r,double a) {
  5. }
  6. }

846b7a953f0546d9b8044909739e528c.png

此时我们就可以使用普通方法来创建对象,因此多种方法构造,直接使用不同的方法名就行,参数就不用再区分了!


我们继续说线程池部分的知识

构建好十个线程后我们就可以利用线程来完成任务,线程池提供了一个重要的方法-submit,可以给线程池提供若干个任务.

  1. public static void main(String[] args) {
  2. ExecutorService pool = Executors.newFixedThreadPool(10);
  3. pool.submit(new Runnable() {
  4. @Override
  5. public void run() {
  6. System.out.println("hello");
  7. }
  8. });
  9. }

e16539e501c042898b68942874c6a67b.png

运行程序我们发现:主线程结束了,整个进程还没有结束,线程池中的线程都是前台线程,此时会阻止进程结束(定时器也是如此)

我们创建多个任务提交

  1. public static void main(String[] args) {
  2. ExecutorService pool = Executors.newFixedThreadPool(10);
  3. for (int i = 0; i < 1000; i++) {
  4. int n = i;
  5. pool.submit(new Runnable() {
  6. @Override
  7. public void run() {
  8. System.out.println("hello "+n);
  9. }
  10. });
  11. }
  12. }

50bba567ca9c479b86469fa7f33471bb.png

这1000个任务就是由十个线程一起完成的,差不多是一个线程执行一百个,不是严格的一个一百,由于每个任务时间差不多,因此每个线程执行的数量也差不多.这个操作类似于排队做核酸,核酸点人数都差不多,做核酸速度也差不多,因此相同时间大概完成的数量是相同的!

lamada表达式的变量捕获

还有个问题,能不能不定义n

d307c966a64a4f6da9786411b98cfa70.png

实际上是不行的,会出现这个错误:

c05d8515c9ea41f5805721dcf72903c8.png

这个语法规则和lamada表达式的变量捕获有关.

c5562b1b6c9245fdb2ff09f5b624f92b.png

此处的run方法属于Runnable.这个方法的执行时机不是立即执行,而是在未来的某个时间节点上(后续的线程池队列中,排队到他了就去执行)

变量i是主线程 的局部变量,随着主线程执行结束,他就销毁了,很可能主线程的for循环执行完了,当前run的任务在线程池中没排到,这是i已经销毁了

为了避免执行run的时候i已经销毁,于是就有了变量捕获,也就是让run方法把刚才的主线程的i给当前run的栈上拷贝一份(在定义run的时候偷偷记住一分i,后续执行run的时候,也创建一个i的局部变量,并且赋值给n)

这个过程称为变量捕获,是为了抹平生命周期的差异,i本来跟着主线程的生命周期走,但run方法实际在主线程生命周期之外还需要使用i,所以需要进行一份拷贝

在Java中,对变量捕获作了一些额外的要求,JDK1.8之前,要求只能捕获final修饰的变量,1.8开始.放松了标准,只要代码中没有修改这个变量,也可以捕获.此处i是有修改的,但是n没有修改可以捕获

d15136fcc2ed4763b3a97b763e26f823.png


Executors这个工厂类给我们提供了很多种风格的线程池

ee99264973054d3ea0d6b87c3d506763.png

  1. Executors.newCachedThreadPool()

这个线程池的线程数量是动态可变的,如果任务多了,就多增加几个线程,线程少了,就少创建几个线程

  1. Executors.newSingleThreadExecutor()

这个线程池里只有一个线程,用的比较少

  1. Executors.newScheduledThreadPool()

类似于定时器,也是让任务延时运行,只不过执行的时候不是由扫描线程自己执行,而是由单独的线程池来执行

这几种线程池本质都是通过包装ThreadPoolExexutor来实现的

这个线程池用起来比较麻烦,所以才提供了工厂类,让我们使用起来简便,这也意味着它本身的功能更强大


ThreadPoolExexutor类

java.util.concurrent这个包中的很多类都是和并发编程(多线程编程)密切相关的,也成为JUC

打开这个包,找到

018e6c1b9cf4482093ee738d6ff706c1.png

找到该类提供的构造方法

098acd4c484d4ddfacb206ae0c189245.png

第四个版本参数,方法是最多的.我们逐个分析

  1. int corePoolSize

这个参数是核心线程数

  1. int maximumPoolSize

这个参数是最大线程数

ThreadPoolExexutor相当于把里面的线程分为两类

一类是正式工(核心线程数),一类是临时工,两个加起来就是最大行程数

允许正式员工摸鱼,临时工不能摸鱼,临时工摸鱼就会被开除(销毁)!!

如果任务很多,那么我们就要更多的线程来完成,但一个程序的任务有时多有时少,少时我们需要对现有的线程进行一定的销毁..原则时正式工(核心线程)留着,临时工动态调节!实际开发时线程池中的线程设置为多少(N(cpu核数),N+1,1.5N,2N….)是不准确的,面试遇到,回答具体数字那么肯定是答错了..

对不同的程序,需要设置的线程数也是不同的

需要考虑两个极端情况:
CPU密集型
每个线程执行的任务都是需要使用CPU的,此时线程池线程数最多不应该超过CPU核数,设置的更大也无效.因为cpu就那么多
IO密集型
每个线程干的工作就是等待IO(读写硬盘,读写网卡,等待用户输入….),不多占用CPU,此时线程处于阻塞状态,不参与调度,这是线程数多一点也没事,不再受制于CPU的核数了.

然而实际开发种.往往一部分吃cpu,一部分等待IO,所以要在实践中确定线程数量,通过测试/实验来确定!!

  1. long keepAliveTime, TimeUnit unit,

这两个参数描述了临时工摸鱼的最大时间…如果超过这个时间,线程就被销毁了!

  1. BlockingQueue<Runnable> workQueue

这个是线程池的任务队列.此处使用阻塞队列,若没有任务,就阻塞,有就take成功…

  1. ThreadFactory threadFactory

用于线程池创建线程

  1. RejectedExecutionHandler handler

描述了线程池的”拒绝策略”..也是一个特殊的对象,描述了当线程池任务队列满了,如果继续添加任务会有什么行为

看看标准库提供的拒绝策略:

646ce171410944e8b6c6eef1a91b3249.png

第一种:如果任务太多,队列满了,直接抛出异常

第二种:如果队列满了,多出来的任务,谁添加的谁负责执行

第三种:如果队列满了,丢弃最早的任务

第四种:丢弃最新的任务

针对ThreadPoolExexutor的参数的解释是高频的面试题,需要牢记

3.实现线程池

一个线程池,要有一个阻塞队列,保存任务.还要有若干个工作线程

  1. import java.util.concurrent.BlockingQueue;
  2. import java.util.concurrent.LinkedBlockingQueue;
  3. public class Test {
  4. public static void main(String[] args) throws InterruptedException {
  5. MyThreadPool myThreadPool = new MyThreadPool(10);
  6. for (int i = 0; i < 1000; i++) {
  7. int n = i;
  8. myThreadPool.submit(new Runnable() {
  9. @Override
  10. public void run() {
  11. System.out.println("hello"+n);
  12. }
  13. });
  14. }
  15. }
  16. }
  17. class MyThreadPool{
  18. private BlockingQueue<Runnable> queue = new LinkedBlockingQueue<>();
  19. //n表示线程数
  20. public MyThreadPool(int n){
  21. for (int i = 0; i < n; i++) {
  22. Thread t = new Thread(()->{
  23. while(true){
  24. try {
  25. Runnable runnable = queue.take();
  26. runnable.run();
  27. } catch (InterruptedException e) {
  28. throw new RuntimeException(e);
  29. }
  30. }
  31. });
  32. t.start();
  33. }
  34. }
  35. //注册任务线程池
  36. public void submit(Runnable runnable) throws InterruptedException {
  37. queue.put(runnable);
  38. }
  39. }

4e3427726e0f4d398c138b08dbcc53b0.png

发表评论

表情:
评论列表 (有 0 条评论,167人围观)

还没有评论,来说两句吧...

相关阅读

    相关 线案例(4)-线

    我们既然已经有了多线程可以提高我们的工作效率,为什么还要引入线程池呢?那是因为线程池最大的好处就是减少每次启动、销毁线程的损耗,因此可以理解成我们的线程池比一般的多线程更...

    相关 线执行线案例

    使用线程池执行多线程需要如下几个条件 首先是一个线程池,线程池包含一些初始化数据,包含队列大小,核心线程数,最大线程数。 然后是一个实现了 runnable的任务,将该任务