XXXXRT666 commited on
Commit
1338830
·
1 Parent(s): 1a0bd1e
Files changed (1) hide show
  1. inference_webui.py +64 -64
inference_webui.py CHANGED
@@ -746,74 +746,74 @@ This demo is open source under the MIT license. The author does not have any con
746
  本demo以MIT协议开源, 作者不对软件具备任何控制力, 使用软件者、传播软件导出的声音者自负全责. 如不认可该条款, 则不能使用或引用该demo内的任何代码和文件.
747
  """
748
  )
749
- with gr.Group():
750
- gr.Markdown(html_center(i18n("*请上传并填写参考信息"), "h3"))
751
- with gr.Row():
752
- inp_ref = gr.Audio(label=i18n("请上传3~10秒内参考音频,超过会报错!"), type="filepath")
753
- with gr.Column():
754
- ref_text_free = gr.Checkbox(
755
- label=i18n("开启无参考文本模式。不填参考文本亦相当于开启。"),
756
- value=False,
757
- interactive=True,
758
- show_label=True,
759
- )
760
- gr.Markdown(
761
- html_left(
762
- i18n(
763
- "使用无参考文本模式时建议使用微调的GPT,听不清参考音频说的啥(不晓得写啥)可以开。<br>开启后无视填写的参考文本。"
764
- )
765
  )
766
  )
767
- prompt_text = gr.Textbox(label=i18n("参考音频的文本"), value="", lines=3, max_lines=3)
768
- prompt_language = gr.Dropdown(
769
- label=i18n("参考音频的语种"), choices=list(dict_language.keys()), value=i18n("中文")
770
  )
771
- inp_refs = gr.File(
772
- label=i18n(
773
- "可选项:通过拖拽多个文件上传多个参考音频(建议同性),平均融合他们的音色。如不填写此项,音色由左侧单个参考音频控制。"
774
- ),
775
- file_count="multiple",
 
 
 
 
 
 
 
 
 
 
 
 
 
 
776
  )
777
- gr.Markdown(html_center(i18n("*请填写需要合成的目标文本和语种模式"), "h3"))
778
- with gr.Row():
779
- with gr.Column():
780
- text = gr.Textbox(label=i18n("需要合成的文本"), value="", lines=26, max_lines=26)
781
- with gr.Column():
782
- text_language = gr.Dropdown(
783
- label=i18n("需要合成的语种") + i18n(".限制范围越小判别效果越好。"),
784
- choices=list(dict_language.keys()),
785
- value=i18n("中文"),
786
- )
787
- how_to_cut = gr.Dropdown(
788
- label=i18n("怎么切"),
789
- choices=[
790
- i18n("不切"),
791
- i18n("凑四句一切"),
792
- i18n("凑50字一切"),
793
- i18n("按中文句号。切"),
794
- i18n("按英文句号.切"),
795
- i18n("按标点符号切"),
796
- ],
797
- value=i18n("凑四句一切"),
798
- interactive=True,
799
- )
800
- gr.Markdown(value=html_center(i18n("语速调整,高为更快")))
801
- if_freeze = gr.Checkbox(
802
- label=i18n("是否直接对上次合成结果调整语速和音色。防止随机性。"),
803
- value=False,
804
- interactive=True,
805
- show_label=True,
806
- )
807
- speed = gr.Slider(minimum=0.6, maximum=1.65, step=0.05, label=i18n("语速"), value=1, interactive=True)
808
- gr.Markdown(html_center(i18n("GPT采样参数(无参考文本时不要太低。不懂就用默认):")))
809
- top_k = gr.Slider(minimum=1, maximum=100, step=1, label=i18n("top_k"), value=15, interactive=True)
810
- top_p = gr.Slider(minimum=0, maximum=1, step=0.05, label=i18n("top_p"), value=1, interactive=True)
811
- temperature = gr.Slider(
812
- minimum=0, maximum=1, step=0.05, label=i18n("temperature"), value=1, interactive=True
813
- )
814
- with gr.Row():
815
- inference_button = gr.Button(i18n("合成语音"), variant="primary", size="lg")
816
- output = gr.Audio(label=i18n("输出的语音"))
817
 
818
  inference_button.click(
819
  get_tts_wav,
 
746
  本demo以MIT协议开源, 作者不对软件具备任何控制力, 使用软件者、传播软件导出的声音者自负全责. 如不认可该条款, 则不能使用或引用该demo内的任何代码和文件.
747
  """
748
  )
749
+ gr.Markdown(html_center(i18n("*请上传并填写参考信息"), "h3"))
750
+ with gr.Row(equal_height=True):
751
+ inp_ref = gr.Audio(label=i18n("请上传3~10秒内参考音频,超过会报错!"), type="filepath")
752
+ with gr.Column():
753
+ ref_text_free = gr.Checkbox(
754
+ label=i18n("开启无参考文本模式。不填参考文本亦相当于开启。"),
755
+ value=False,
756
+ interactive=True,
757
+ show_label=True,
758
+ )
759
+ gr.Markdown(
760
+ html_left(
761
+ i18n(
762
+ "使用无参考文本模式时建议使用微调的GPT,听不清参考音频说的啥(不晓得写啥)可以开。<br>开启后无视填写的参考文本。"
 
 
763
  )
764
  )
 
 
 
765
  )
766
+ prompt_text = gr.Textbox(label=i18n("参考音频的文本"), value="", lines=3, max_lines=3)
767
+ prompt_language = gr.Dropdown(
768
+ label=i18n("参考音频的语种"), choices=list(dict_language.keys()), value=i18n("中文")
769
+ )
770
+ inp_refs = gr.File(
771
+ label=i18n(
772
+ "可选项:通过拖拽多个文件上传多个参考音频(建议同性),平均融合他们的音色。如不填写此项,音色由左侧单个参考音频控制。"
773
+ ),
774
+ file_count="multiple",
775
+ )
776
+ gr.Markdown(html_center(i18n("*请填写需要合成的目标文本和语种模式"), "h3"))
777
+ with gr.Row(equal_height=True):
778
+ with gr.Column():
779
+ text = gr.Textbox(label=i18n("需要合成的文本"), value="", lines=26, max_lines=26)
780
+ with gr.Column():
781
+ text_language = gr.Dropdown(
782
+ label=i18n("需要合成的语种") + i18n(".限制范围越小判别效果越好。"),
783
+ choices=list(dict_language.keys()),
784
+ value=i18n("中文"),
785
  )
786
+ how_to_cut = gr.Dropdown(
787
+ label=i18n("怎么切"),
788
+ choices=[
789
+ i18n("不切"),
790
+ i18n("凑四句一切"),
791
+ i18n("凑50字一切"),
792
+ i18n("按中文句号。切"),
793
+ i18n("按英文句号.切"),
794
+ i18n("按标点符号切"),
795
+ ],
796
+ value=i18n("凑四句一切"),
797
+ interactive=True,
798
+ )
799
+ gr.Markdown(value=html_center(i18n("语速调整,高为更快")))
800
+ if_freeze = gr.Checkbox(
801
+ label=i18n("是否直接对上次合成结果调整语速和音色。防止随机性。"),
802
+ value=False,
803
+ interactive=True,
804
+ show_label=True,
805
+ )
806
+ speed = gr.Slider(minimum=0.6, maximum=1.65, step=0.05, label=i18n("语速"), value=1, interactive=True)
807
+ gr.Markdown(html_center(i18n("GPT采样参数(无参考文本时不要太低。不懂就用默认):")))
808
+ top_k = gr.Slider(minimum=1, maximum=100, step=1, label=i18n("top_k"), value=15, interactive=True)
809
+ top_p = gr.Slider(minimum=0, maximum=1, step=0.05, label=i18n("top_p"), value=1, interactive=True)
810
+ temperature = gr.Slider(
811
+ minimum=0, maximum=1, step=0.05, label=i18n("temperature"), value=1, interactive=True
812
+ )
813
+ with gr.Row(equal_height=True):n("合成语音"), variant="primary", size="lg")
814
+
815
+ inference_button = gr.Button(i18n("合成语音"), variant="primary", size="lg")
816
+ output = gr.Audio(label=i18n("输出的语音"))
 
 
 
 
 
 
 
 
 
817
 
818
  inference_button.click(
819
  get_tts_wav,