VOICEVOX-Nemo-Engine

Running

VOICEVOX-Nemo-Engine / voicevox_nemo_engine /voicevox_engine /cancellable_engine.py

Jirat Jaturanpinyo

Upload voicevox_nemo_engine

329ce4a verified 12 months ago

8.83 kB

	import asyncio
	import queue
	import sys
	from multiprocessing import Pipe, Process

	if sys.platform == "win32":
	from multiprocessing.connection import PipeConnection as ConnectionType
	else:
	from multiprocessing.connection import Connection as ConnectionType

	from pathlib import Path
	from tempfile import NamedTemporaryFile

	import soundfile

	# FIXME: remove FastAPI dependency
	from fastapi import HTTPException, Request

	from .model import AudioQuery
	from .synthesis_engine import make_synthesis_engines
	from .utility import get_latest_core_version


	class CancellableEngine:
	"""
	音声合成のキャンセル機能に関するクラス
	初期化後は、synthesis関数で音声合成できる
	（オリジナルと比べ引数が増えているので注意）

	パラメータ use_gpu, voicelib_dirs, voicevox_dir,
	runtime_dirs, cpu_num_threads, enable_mock は、 make_synthesis_engines を参照

	Attributes
	----------
	watch_con_list: list[tuple[Request, Process]]
	Requestは接続の監視に使用され、Processは通信切断時のプロセスキルに使用される
	クライアントから接続があるとListにTupleが追加される
	接続が切断、もしくは音声合成が終了すると削除される
	procs_and_cons: queue.Queue[tuple[Process, ConnectionType]]
	音声合成の準備が終わっているプロセスのList
	（音声合成中のプロセスは入っていない）
	"""

	def __init__(
	self,
	init_processes: int,
	use_gpu: bool,
	voicelib_dirs: list[Path] \| None,
	voicevox_dir: Path \| None,
	runtime_dirs: list[Path] \| None,
	cpu_num_threads: int \| None,
	enable_mock: bool,
	) -> None:
	"""
	変数の初期化を行う
	また、init_processesの数だけプロセスを起動し、procs_and_consに格納する
	"""

	self.use_gpu = use_gpu
	self.voicelib_dirs = voicelib_dirs
	self.voicevox_dir = voicevox_dir
	self.runtime_dirs = runtime_dirs
	self.cpu_num_threads = cpu_num_threads
	self.enable_mock = enable_mock

	self.watch_con_list: list[tuple[Request, Process]] = []

	procs_and_cons: queue.Queue[tuple[Process, ConnectionType]] = queue.Queue()
	for _ in range(init_processes):
	procs_and_cons.put(self.start_new_proc())
	self.procs_and_cons = procs_and_cons

	def start_new_proc(
	self,
	) -> tuple[Process, ConnectionType]:
	"""
	新しく開始したプロセスを返す関数

	Returns
	-------
	ret_proc: Process
	新規のプロセス
	sub_proc_con1: ConnectionType
	ret_procのプロセスと通信するためのPipe
	"""
	sub_proc_con1, sub_proc_con2 = Pipe(True)
	ret_proc = Process(
	target=start_synthesis_subprocess,
	kwargs={
	"use_gpu": self.use_gpu,
	"voicelib_dirs": self.voicelib_dirs,
	"voicevox_dir": self.voicevox_dir,
	"runtime_dirs": self.runtime_dirs,
	"cpu_num_threads": self.cpu_num_threads,
	"enable_mock": self.enable_mock,
	"sub_proc_con": sub_proc_con2,
	},
	daemon=True,
	)
	ret_proc.start()
	return ret_proc, sub_proc_con1

	def finalize_con(
	self,
	req: Request,
	proc: Process,
	sub_proc_con: ConnectionType \| None,
	) -> None:
	"""
	接続が切断された時の処理を行う関数
	watch_con_listからの削除、プロセスの後処理を行う
	プロセスが生きている場合はそのままprocs_and_consに加える
	死んでいる場合は新しく生成したものをprocs_and_consに加える

	Parameters
	----------
	req: fastapi.Request
	接続確立時に受け取ったものをそのまま渡せばよい
	https://fastapi.tiangolo.com/advanced/using-request-directly/
	proc: Process
	音声合成を行っていたプロセス
	sub_proc_con: ConnectionType, optional
	音声合成を行っていたプロセスとのPipe
	指定されていない場合、プロセスは再利用されず終了される
	"""
	try:
	self.watch_con_list.remove((req, proc))
	except ValueError:
	pass
	try:
	if not proc.is_alive() or sub_proc_con is None:
	proc.close()
	raise ValueError
	# プロセスが死んでいない場合は再利用する
	self.procs_and_cons.put((proc, sub_proc_con))
	except ValueError:
	# プロセスが死んでいるので新しく作り直す
	self.procs_and_cons.put(self.start_new_proc())

	def _synthesis_impl(
	self,
	query: AudioQuery,
	style_id: int,
	request: Request,
	core_version: str \| None,
	) -> str:
	"""
	音声合成を行う関数
	通常エンジンの引数に比べ、requestが必要になっている
	また、返り値がファイル名になっている

	Parameters
	----------
	query: AudioQuery
	style_id: int
	request: fastapi.Request
	接続確立時に受け取ったものをそのまま渡せばよい
	https://fastapi.tiangolo.com/advanced/using-request-directly/
	core_version: str

	Returns
	-------
	f_name: str
	生成された音声ファイルの名前
	"""
	proc, sub_proc_con1 = self.procs_and_cons.get()
	self.watch_con_list.append((request, proc))
	try:
	sub_proc_con1.send((query, style_id, core_version))
	f_name = sub_proc_con1.recv()
	except EOFError:
	raise HTTPException(status_code=422, detail="既にサブプロセスは終了されています")
	except Exception:
	self.finalize_con(request, proc, sub_proc_con1)
	raise

	self.finalize_con(request, proc, sub_proc_con1)
	return f_name

	async def catch_disconnection(self):
	"""
	接続監視を行うコルーチン
	"""
	while True:
	await asyncio.sleep(1)
	for con in self.watch_con_list:
	req, proc = con
	if await req.is_disconnected():
	try:
	if proc.is_alive():
	proc.terminate()
	proc.join()
	proc.close()
	except ValueError:
	pass
	finally:
	self.finalize_con(req, proc, None)


	def start_synthesis_subprocess(
	use_gpu: bool,
	voicelib_dirs: list[Path] \| None,
	voicevox_dir: Path \| None,
	runtime_dirs: list[Path] \| None,
	cpu_num_threads: int \| None,
	enable_mock: bool,
	sub_proc_con: ConnectionType,
	) -> None:
	"""
	音声合成を行うサブプロセスで行うための関数
	pickle化の関係でグローバルに書いている

	引数 use_gpu, voicelib_dirs, voicevox_dir,
	runtime_dirs, cpu_num_threads, enable_mock は、 make_synthesis_engines を参照

	Parameters
	----------
	sub_proc_con: ConnectionType
	メインプロセスと通信するためのPipe
	"""

	synthesis_engines = make_synthesis_engines(
	use_gpu=use_gpu,
	voicelib_dirs=voicelib_dirs,
	voicevox_dir=voicevox_dir,
	runtime_dirs=runtime_dirs,
	cpu_num_threads=cpu_num_threads,
	enable_mock=enable_mock,
	)
	assert len(synthesis_engines) != 0, "音声合成エンジンがありません。"
	latest_core_version = get_latest_core_version(versions=synthesis_engines.keys())
	while True:
	try:
	query, style_id, core_version = sub_proc_con.recv()
	if core_version is None:
	_engine = synthesis_engines[latest_core_version]
	elif core_version in synthesis_engines:
	_engine = synthesis_engines[core_version]
	else:
	# バージョンが見つからないエラー
	sub_proc_con.send("")
	continue
	wave = _engine._synthesis_impl(query, style_id)
	with NamedTemporaryFile(delete=False) as f:
	soundfile.write(
	file=f, data=wave, samplerate=query.outputSamplingRate, format="WAV"
	)
	sub_proc_con.send(f.name)
	except Exception:
	sub_proc_con.close()
	raise