假设循环爬取10000个网页,需要开辟10000个线程,这个对cpu和内存会造成一定的消耗,
- # 线程池:一次性开辟一些线程,我们用户之际而给线程池提交任务,这些任务的调度交给线程池来完成
-
- from concurrent.futures import ThreadPoolExecutor,ProcessPoolExecutor
-
- def func(name):
- for i in range(100):
- print(name,i)
-
-
- if __name__ == '__main__':
- # 创建线程池
- with ThreadPoolExecutor(50) as t: # 守护线程,with这里会等待线程执行完毕才会跳出来
- # with ThreadPoolExecutor(50) as t: # 守护进程,改个名字而已
- for i in range (100): # 创建100个任务
- t.submit(func,name=f'线程{i}') # 提交任务 ,name为函数fuc的入参
-
- print('运行结束') # 上面运行完执行这个
-
-
-
- >>>
- 线程97 99线程95
- 96
- 线程95 97
- 线程95 98
- 线程95 99
- 运行结束