Spaces:

JacobLinCool
/

ZeroRVC

Paused

App Files Files Community

ZeroRVC / app /infer.py

JacobLinCool

fix: demucs import

385c19b about 1 year ago

raw

history blame

3.08 kB

	from glob import glob
	import os
	from typing import Tuple
	from demucs.separate import main as demucs
	import gradio as gr
	import numpy as np
	import soundfile as sf
	from configs.config import Config
	from infer.modules.vc.modules import VC
	from zero import zero
	from model import device


	@zero(duration=120)
	def infer(exp_dir: str, original_audio: str, f0add: int) -> Tuple[int, np.ndarray]:
	name = os.path.basename(exp_dir)
	model = os.path.join(exp_dir, f"{name}.pth")
	if not os.path.exists(model):
	raise gr.Error("Model not found")

	index = glob(f"{exp_dir}/added_*.index")
	if not index:
	raise gr.Error("Index not found")

	base = os.path.basename(original_audio)
	base = os.path.splitext(base)[0]
	demucs(
	["--two-stems", "vocals", "-d", str(device), "-n", "htdemucs", original_audio]
	)
	out = os.path.join("separated", "htdemucs", base, "vocals.wav")

	cfg = Config()
	vc = VC(cfg)
	vc.get_vc(model)
	_, wav_opt = vc.vc_single(
	0,
	out,
	f0add,
	None,
	"rmvpe",
	index,
	None,
	0.5,
	3,
	0,
	1,
	0.33,
	)

	sr = wav_opt[0]
	data = wav_opt[1]

	return sr, data


	def merge(exp_dir: str, original_audio: str, vocal: Tuple[int, np.ndarray]) -> str:
	base = os.path.basename(original_audio)
	base = os.path.splitext(base)[0]
	music = os.path.join("separated", "htdemucs", base, "no-vocals.wav")

	tmp = os.path.join(exp_dir, "tmp.wav")
	sf.write(tmp, vocal[1], vocal[0])

	os.system(
	f"ffmpeg -i {music} -i {tmp} -filter_complex '[1]volume=2[a];[0][a]amix=inputs=2:duration=first:dropout_transition=2' {tmp}.merged.mp3"
	)

	return f"{tmp}.merged.mp3"


	class InferenceTab:
	def __init__(self):
	pass

	def ui(self):
	gr.Markdown("# Inference")
	gr.Markdown(
	"After trained model is pruned, you can use it to infer on new music. \n"
	"Upload the original audio and adjust the F0 add value to generate the inferred audio."
	)

	with gr.Row():
	self.original_audio = gr.Audio(
	label="Upload original audio",
	type="filepath",
	show_download_button=True,
	)
	self.f0add = gr.Slider(
	label="F0 add",
	minimum=-16,
	maximum=16,
	step=1,
	value=0,
	)
	self.infer_btn = gr.Button(value="Infer", variant="primary")
	with gr.Row():
	self.infer_output = gr.Audio(label="Inferred audio")
	with gr.Row():
	self.merge_output = gr.Audio(label="Merged audio")

	def build(self, exp_dir: gr.Textbox):
	self.infer_btn.click(
	fn=infer,
	inputs=[exp_dir, self.original_audio, self.f0add],
	outputs=[self.infer_output],
	).success(
	fn=merge,
	inputs=[exp_dir, self.original_audio, self.infer_output],
	outputs=[self.merge_output],
	)