Spaces:

XXXXRT
/

GPT-SoVITS-ProPlus

Running on Zero

App Files Files Community

XXXXRT666 commited on Jun 29

Commit

1338830

1 Parent(s): 1a0bd1e

.

Browse files

Files changed (1) hide show

inference_webui.py +64 -64

inference_webui.py CHANGED Viewed

@@ -746,74 +746,74 @@ This demo is open source under the MIT license. The author does not have any con
 本demo以MIT协议开源, 作者不对软件具备任何控制力, 使用软件者、传播软件导出的声音者自负全责. 如不认可该条款, 则不能使用或引用该demo内的任何代码和文件.
 """
     )
-    with gr.Group():
-        gr.Markdown(html_center(i18n("*请上传并填写参考信息"), "h3"))
-        with gr.Row():
-            inp_ref = gr.Audio(label=i18n("请上传3~10秒内参考音频，超过会报错！"), type="filepath")
-            with gr.Column():
-                ref_text_free = gr.Checkbox(
-                    label=i18n("开启无参考文本模式。不填参考文本亦相当于开启。"),
-                    value=False,
-                    interactive=True,
-                    show_label=True,
-                )
-                gr.Markdown(
-                    html_left(
-                        i18n(
-                            "使用无参考文本模式时建议使用微调的GPT，听不清参考音频说的啥(不晓得写啥)可以开。<br>开启后无视填写的参考文本。"
-                        )
                     )
                 )
-                prompt_text = gr.Textbox(label=i18n("参考音频的文本"), value="", lines=3, max_lines=3)
-            prompt_language = gr.Dropdown(
-                label=i18n("参考音频的语种"), choices=list(dict_language.keys()), value=i18n("中文")
             )
-            inp_refs = gr.File(
-                label=i18n(
-                    "可选项：通过拖拽多个文件上传多个参考音频（建议同性），平均融合他们的音色。如不填写此项，音色由左侧单个参考音频控制。"
-                ),
-                file_count="multiple",
             )
-        gr.Markdown(html_center(i18n("*请填写需要合成的目标文本和语种模式"), "h3"))
-        with gr.Row():
-            with gr.Column():
-                text = gr.Textbox(label=i18n("需要合成的文本"), value="", lines=26, max_lines=26)
-            with gr.Column():
-                text_language = gr.Dropdown(
-                    label=i18n("需要合成的语种") + i18n(".限制范围越小判别效果越好。"),
-                    choices=list(dict_language.keys()),
-                    value=i18n("中文"),
-                )
-                how_to_cut = gr.Dropdown(
-                    label=i18n("怎么切"),
-                    choices=[
-                        i18n("不切"),
-                        i18n("凑四句一切"),
-                        i18n("凑50字一切"),
-                        i18n("按中文句号。切"),
-                        i18n("按英文句号.切"),
-                        i18n("按标点符号切"),
-                    ],
-                    value=i18n("凑四句一切"),
-                    interactive=True,
-                )
-                gr.Markdown(value=html_center(i18n("语速调整，高为更快")))
-                if_freeze = gr.Checkbox(
-                    label=i18n("是否直接对上次合成结果调整语速和音色。防止随机性。"),
-                    value=False,
-                    interactive=True,
-                    show_label=True,
-                )
-                speed = gr.Slider(minimum=0.6, maximum=1.65, step=0.05, label=i18n("语速"), value=1, interactive=True)
-                gr.Markdown(html_center(i18n("GPT采样参数(无参考文本时不要太低。不懂就用默认)：")))
-                top_k = gr.Slider(minimum=1, maximum=100, step=1, label=i18n("top_k"), value=15, interactive=True)
-                top_p = gr.Slider(minimum=0, maximum=1, step=0.05, label=i18n("top_p"), value=1, interactive=True)
-                temperature = gr.Slider(
-                    minimum=0, maximum=1, step=0.05, label=i18n("temperature"), value=1, interactive=True
-                )
-        with gr.Row():
-            inference_button = gr.Button(i18n("合成语音"), variant="primary", size="lg")
-            output = gr.Audio(label=i18n("输出的语音"))
         inference_button.click(
             get_tts_wav,

 本demo以MIT协议开源, 作者不对软件具备任何控制力, 使用软件者、传播软件导出的声音者自负全责. 如不认可该条款, 则不能使用或引用该demo内的任何代码和文件.
 """
     )
+    gr.Markdown(html_center(i18n("*请上传并填写参考信息"), "h3"))
+    with gr.Row(equal_height=True):
+        inp_ref = gr.Audio(label=i18n("请上传3~10秒内参考音频，超过会报错！"), type="filepath")
+        with gr.Column():
+            ref_text_free = gr.Checkbox(
+                label=i18n("开启无参考文本模式。不填参考文本亦相当于开启。"),
+                value=False,
+                interactive=True,
+                show_label=True,
+            )
+            gr.Markdown(
+                html_left(
+                    i18n(
+                        "使用无参考文本模式时建议使用微调的GPT，听不清参考音频说的啥(不晓得写啥)可以开。<br>开启后无视填写的参考文本。"
                     )
                 )
             )
+            prompt_text = gr.Textbox(label=i18n("参考音频的文本"), value="", lines=3, max_lines=3)
+        prompt_language = gr.Dropdown(
+            label=i18n("参考音频的语种"), choices=list(dict_language.keys()), value=i18n("中文")
+        )
+        inp_refs = gr.File(
+            label=i18n(
+                "可选项：通过拖拽多个文件上传多个参考音频（建议同性），平均融合他们的音色。如不填写此项，音色由左侧单个参考音频控制。"
+            ),
+            file_count="multiple",
+        )
+    gr.Markdown(html_center(i18n("*请填写需要合成的目标文本和语种模式"), "h3"))
+    with gr.Row(equal_height=True):
+        with gr.Column():
+            text = gr.Textbox(label=i18n("需要合成的文本"), value="", lines=26, max_lines=26)
+        with gr.Column():
+            text_language = gr.Dropdown(
+                label=i18n("需要合成的语种") + i18n(".限制范围越小判别效果越好。"),
+                choices=list(dict_language.keys()),
+                value=i18n("中文"),
             )
+            how_to_cut = gr.Dropdown(
+                label=i18n("怎么切"),
+                choices=[
+                    i18n("不切"),
+                    i18n("凑四句一切"),
+                    i18n("凑50字一切"),
+                    i18n("按中文句号。切"),
+                    i18n("按英文句号.切"),
+                    i18n("按标点符号切"),
+                ],
+                value=i18n("凑四句一切"),
+                interactive=True,
+            )
+            gr.Markdown(value=html_center(i18n("语速调整，高为更快")))
+            if_freeze = gr.Checkbox(
+                label=i18n("是否直接对上次合成结果调整语速和音色。防止随机性。"),
+                value=False,
+                interactive=True,
+                show_label=True,
+            )
+            speed = gr.Slider(minimum=0.6, maximum=1.65, step=0.05, label=i18n("语速"), value=1, interactive=True)
+            gr.Markdown(html_center(i18n("GPT采样参数(无参考文本时不要太低。不懂就用默认)：")))
+            top_k = gr.Slider(minimum=1, maximum=100, step=1, label=i18n("top_k"), value=15, interactive=True)
+            top_p = gr.Slider(minimum=0, maximum=1, step=0.05, label=i18n("top_p"), value=1, interactive=True)
+            temperature = gr.Slider(
+                minimum=0, maximum=1, step=0.05, label=i18n("temperature"), value=1, interactive=True
+            )
+        with gr.Row(equal_height=True):n("合成语音"), variant="primary", size="lg")
+        inference_button = gr.Button(i18n("合成语音"), variant="primary", size="lg")
+        output = gr.Audio(label=i18n("输出的语音"))
         inference_button.click(
             get_tts_wav,