Ответ 1
Вам не нужны потоки для параллельной работы подпроцессов:
from subprocess import Popen
commands = [
'date; ls -l; sleep 1; date',
'date; sleep 5; date',
'date; df -h; sleep 3; date',
'date; hostname; sleep 2; date',
'date; uname -a; date',
]
# run in parallel
processes = [Popen(cmd, shell=True) for cmd in commands]
# do other things here..
# wait for completion
for p in processes: p.wait()
Чтобы ограничить количество одновременных команд, вы можете использовать multiprocessing.dummy.Pool
, который использует потоки и предоставляет тот же интерфейс, что и multiprocessing.Pool
, который использует процессы:
from functools import partial
from multiprocessing.dummy import Pool
from subprocess import call
pool = Pool(2) # two concurrent commands at a time
for i, returncode in enumerate(pool.imap(partial(call, shell=True), commands)):
if returncode != 0:
print("%d command failed: %d" % (i, returncode))
Этот ответ демонстрирует различные методы для ограничения количества параллельных подпроцессов: он показывает многопроцессорность .Pool, concurrent.futures, threading + решения на основе очереди.
Вы можете ограничить количество параллельных дочерних процессов без использования пула потоков/процессов:
from subprocess import Popen
from itertools import islice
max_workers = 2 # no more than 2 concurrent processes
processes = (Popen(cmd, shell=True) for cmd in commands)
running_processes = list(islice(processes, max_workers)) # start new processes
while running_processes:
for i, process in enumerate(running_processes):
if process.poll() is not None: # the process has finished
running_processes[i] = next(processes, None) # start new process
if running_processes[i] is None: # no new processes
del running_processes[i]
break
В Unix вы можете избежать цикла занятости и block на os.waitpid(-1, 0)
, чтобы дождаться завершения любого дочернего процесса.