Spaces:
Running
Running
Hưng
commited on
Commit
·
41b7348
1
Parent(s):
a0fbc02
update model link
Browse files
app.py
CHANGED
@@ -23,7 +23,7 @@ model = load_model(
|
|
23 |
DiT,
|
24 |
dict(dim=1024, depth=22, heads=16, ff_mult=2, text_dim=512, conv_layers=4),
|
25 |
ckpt_path=str(
|
26 |
-
cached_path("hf://zalopay/vietnamese-tts/
|
27 |
),
|
28 |
mel_spec_type="vocos",
|
29 |
vocab_file=str(cached_path("hf://zalopay/vietnamese-tts/vocab.txt")),
|
@@ -38,6 +38,8 @@ def infer(ref_audio_orig: str, ref_text: str, gen_text: str, speed: float = 1.0)
|
|
38 |
if gen_text is None or gen_text.strip() == "":
|
39 |
raise gr.Error("Text to generate is required.")
|
40 |
|
|
|
|
|
41 |
if ref_text is None or ref_text.strip() == "":
|
42 |
raise gr.Error("Ref Text is required.")
|
43 |
|
@@ -46,7 +48,7 @@ def infer(ref_audio_orig: str, ref_text: str, gen_text: str, speed: float = 1.0)
|
|
46 |
gr.Info("Generated audio text: {} with audio file {} ".format(ref_text, ref_audio_orig))
|
47 |
final_wave, final_sample_rate, combined_spectrogram = infer_process(
|
48 |
ref_audio,
|
49 |
-
ref_text,
|
50 |
gen_text,
|
51 |
model,
|
52 |
vocoder,
|
@@ -103,6 +105,12 @@ iface = gr.Interface(
|
|
103 |
"Bạn đã nhận được thanh toán thành công số tiền ba mươi ngàn đồng",
|
104 |
1.0,
|
105 |
],
|
|
|
|
|
|
|
|
|
|
|
|
|
106 |
],
|
107 |
)
|
108 |
|
|
|
23 |
DiT,
|
24 |
dict(dim=1024, depth=22, heads=16, ff_mult=2, text_dim=512, conv_layers=4),
|
25 |
ckpt_path=str(
|
26 |
+
cached_path("hf://zalopay/vietnamese-tts/model_1290000.pt")
|
27 |
),
|
28 |
mel_spec_type="vocos",
|
29 |
vocab_file=str(cached_path("hf://zalopay/vietnamese-tts/vocab.txt")),
|
|
|
38 |
if gen_text is None or gen_text.strip() == "":
|
39 |
raise gr.Error("Text to generate is required.")
|
40 |
|
41 |
+
gen_text = " " + gen_text.lower()
|
42 |
+
|
43 |
if ref_text is None or ref_text.strip() == "":
|
44 |
raise gr.Error("Ref Text is required.")
|
45 |
|
|
|
48 |
gr.Info("Generated audio text: {} with audio file {} ".format(ref_text, ref_audio_orig))
|
49 |
final_wave, final_sample_rate, combined_spectrogram = infer_process(
|
50 |
ref_audio,
|
51 |
+
ref_text.lower(),
|
52 |
gen_text,
|
53 |
model,
|
54 |
vocoder,
|
|
|
105 |
"Bạn đã nhận được thanh toán thành công số tiền ba mươi ngàn đồng",
|
106 |
1.0,
|
107 |
],
|
108 |
+
[
|
109 |
+
"examples/pc-02.wav",
|
110 |
+
"sông Đồng Nai là con sông nội địa dài nhất Việt Nam, lớn thứ nhì nam bộ về lưu vực chỉ sau sông Cửu long",
|
111 |
+
"Ứng dụng thanh toán Zalopay chính thức ra mắt phiên bản mới với các thay đổi hấp dẫn, làm mới mọi trải nghiệm về tiền",
|
112 |
+
1.0,
|
113 |
+
],
|
114 |
],
|
115 |
)
|
116 |
|