Python中的multiprocessing.dummy没有使用100%cpu
我正在用Python做一个机器学习项目,所以我必须做并行预测功能,这是我在程序中使用的功能。
from multiprocessing.dummy import Pool
from multiprocessing import cpu_count
def multi_predict(X, predict, *args, **kwargs):
pool = Pool(cpu_count())
results = pool.map(predict, X)
pool.close()
pool.join()
return results
问题是我所有的CPU仅加载20-40%(总和为100%)。我使用multiprocessing.dummy,因为我在酸洗功能中的多处理模块有一些问题。
-
使用时
multiprocessing.dummy
,您使用的是线程,而不是进程:multiprocessing.dummy
复制API的API,multiprocessing
但仅不过是threading
模块周围的包装器。这意味着您受到全局解释器锁(GIL)的限制,并且实际上只有一个线程可以一次执行CPU绑定的操作。这将使您无法充分利用CPU。如果要在所有可用内核之间获得完全的并行性,则需要解决您遇到的酸洗问题
multiprocessing.Pool
。请注意,
multiprocessing.dummy
如果您需要并行化的工作是受IO限制的,或者利用释放GIL的C扩展名,则这可能仍然有用。但是,对于纯Python代码,您需要multiprocessing
。