Spaces:
Running
on
Zero
Running
on
Zero
XXXXRT666
commited on
Commit
·
1338830
1
Parent(s):
1a0bd1e
- inference_webui.py +64 -64
inference_webui.py
CHANGED
@@ -746,74 +746,74 @@ This demo is open source under the MIT license. The author does not have any con
|
|
746 |
本demo以MIT协议开源, 作者不对软件具备任何控制力, 使用软件者、传播软件导出的声音者自负全责. 如不认可该条款, 则不能使用或引用该demo内的任何代码和文件.
|
747 |
"""
|
748 |
)
|
749 |
-
|
750 |
-
|
751 |
-
|
752 |
-
|
753 |
-
|
754 |
-
|
755 |
-
|
756 |
-
|
757 |
-
|
758 |
-
|
759 |
-
|
760 |
-
|
761 |
-
|
762 |
-
|
763 |
-
"使用无参考文本模式时建议使用微调的GPT,听不清参考音频说的啥(不晓得写啥)可以开。<br>开启后无视填写的参考文本。"
|
764 |
-
)
|
765 |
)
|
766 |
)
|
767 |
-
prompt_text = gr.Textbox(label=i18n("参考音频的文本"), value="", lines=3, max_lines=3)
|
768 |
-
prompt_language = gr.Dropdown(
|
769 |
-
label=i18n("参考音频的语种"), choices=list(dict_language.keys()), value=i18n("中文")
|
770 |
)
|
771 |
-
|
772 |
-
|
773 |
-
|
774 |
-
|
775 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
776 |
)
|
777 |
-
|
778 |
-
|
779 |
-
|
780 |
-
|
781 |
-
|
782 |
-
|
783 |
-
|
784 |
-
|
785 |
-
|
786 |
-
|
787 |
-
|
788 |
-
|
789 |
-
|
790 |
-
|
791 |
-
|
792 |
-
|
793 |
-
|
794 |
-
|
795 |
-
|
796 |
-
|
797 |
-
|
798 |
-
|
799 |
-
|
800 |
-
|
801 |
-
|
802 |
-
|
803 |
-
|
804 |
-
|
805 |
-
|
806 |
-
|
807 |
-
|
808 |
-
gr.Markdown(html_center(i18n("GPT采样参数(无参考文本时不要太低。不懂就用默认):")))
|
809 |
-
top_k = gr.Slider(minimum=1, maximum=100, step=1, label=i18n("top_k"), value=15, interactive=True)
|
810 |
-
top_p = gr.Slider(minimum=0, maximum=1, step=0.05, label=i18n("top_p"), value=1, interactive=True)
|
811 |
-
temperature = gr.Slider(
|
812 |
-
minimum=0, maximum=1, step=0.05, label=i18n("temperature"), value=1, interactive=True
|
813 |
-
)
|
814 |
-
with gr.Row():
|
815 |
-
inference_button = gr.Button(i18n("合成语音"), variant="primary", size="lg")
|
816 |
-
output = gr.Audio(label=i18n("输出的语音"))
|
817 |
|
818 |
inference_button.click(
|
819 |
get_tts_wav,
|
|
|
746 |
本demo以MIT协议开源, 作者不对软件具备任何控制力, 使用软件者、传播软件导出的声音者自负全责. 如不认可该条款, 则不能使用或引用该demo内的任何代码和文件.
|
747 |
"""
|
748 |
)
|
749 |
+
gr.Markdown(html_center(i18n("*请上传并填写参考信息"), "h3"))
|
750 |
+
with gr.Row(equal_height=True):
|
751 |
+
inp_ref = gr.Audio(label=i18n("请上传3~10秒内参考音频,超过会报错!"), type="filepath")
|
752 |
+
with gr.Column():
|
753 |
+
ref_text_free = gr.Checkbox(
|
754 |
+
label=i18n("开启无参考文本模式。不填参考文本亦相当于开启。"),
|
755 |
+
value=False,
|
756 |
+
interactive=True,
|
757 |
+
show_label=True,
|
758 |
+
)
|
759 |
+
gr.Markdown(
|
760 |
+
html_left(
|
761 |
+
i18n(
|
762 |
+
"使用无参考文本模式时建议使用微调的GPT,听不清参考音频说的啥(不晓得写啥)可以开。<br>开启后无视填写的参考文本。"
|
|
|
|
|
763 |
)
|
764 |
)
|
|
|
|
|
|
|
765 |
)
|
766 |
+
prompt_text = gr.Textbox(label=i18n("参考音频的文本"), value="", lines=3, max_lines=3)
|
767 |
+
prompt_language = gr.Dropdown(
|
768 |
+
label=i18n("参考音频的语种"), choices=list(dict_language.keys()), value=i18n("中文")
|
769 |
+
)
|
770 |
+
inp_refs = gr.File(
|
771 |
+
label=i18n(
|
772 |
+
"可选项:通过拖拽多个文件上传多个参考音频(建议同性),平均融合他们的音色。如不填写此项,音色由左侧单个参考音频控制。"
|
773 |
+
),
|
774 |
+
file_count="multiple",
|
775 |
+
)
|
776 |
+
gr.Markdown(html_center(i18n("*请填写需要合成的目标文本和语种模式"), "h3"))
|
777 |
+
with gr.Row(equal_height=True):
|
778 |
+
with gr.Column():
|
779 |
+
text = gr.Textbox(label=i18n("需要合成的文本"), value="", lines=26, max_lines=26)
|
780 |
+
with gr.Column():
|
781 |
+
text_language = gr.Dropdown(
|
782 |
+
label=i18n("需要合成的语种") + i18n(".限制范围越小判别效果越好。"),
|
783 |
+
choices=list(dict_language.keys()),
|
784 |
+
value=i18n("中文"),
|
785 |
)
|
786 |
+
how_to_cut = gr.Dropdown(
|
787 |
+
label=i18n("怎么切"),
|
788 |
+
choices=[
|
789 |
+
i18n("不切"),
|
790 |
+
i18n("凑四句一切"),
|
791 |
+
i18n("凑50字一切"),
|
792 |
+
i18n("按中文句号。切"),
|
793 |
+
i18n("按英文句号.切"),
|
794 |
+
i18n("按标点符号切"),
|
795 |
+
],
|
796 |
+
value=i18n("凑四句一切"),
|
797 |
+
interactive=True,
|
798 |
+
)
|
799 |
+
gr.Markdown(value=html_center(i18n("语速调整,高为更快")))
|
800 |
+
if_freeze = gr.Checkbox(
|
801 |
+
label=i18n("是否直接对上次合成结果调整语速和音色。防止随机性。"),
|
802 |
+
value=False,
|
803 |
+
interactive=True,
|
804 |
+
show_label=True,
|
805 |
+
)
|
806 |
+
speed = gr.Slider(minimum=0.6, maximum=1.65, step=0.05, label=i18n("语速"), value=1, interactive=True)
|
807 |
+
gr.Markdown(html_center(i18n("GPT采样参数(无参考文本时不要太低。不懂就用默认):")))
|
808 |
+
top_k = gr.Slider(minimum=1, maximum=100, step=1, label=i18n("top_k"), value=15, interactive=True)
|
809 |
+
top_p = gr.Slider(minimum=0, maximum=1, step=0.05, label=i18n("top_p"), value=1, interactive=True)
|
810 |
+
temperature = gr.Slider(
|
811 |
+
minimum=0, maximum=1, step=0.05, label=i18n("temperature"), value=1, interactive=True
|
812 |
+
)
|
813 |
+
with gr.Row(equal_height=True):n("合成语音"), variant="primary", size="lg")
|
814 |
+
|
815 |
+
inference_button = gr.Button(i18n("合成语音"), variant="primary", size="lg")
|
816 |
+
output = gr.Audio(label=i18n("输出的语音"))
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
817 |
|
818 |
inference_button.click(
|
819 |
get_tts_wav,
|