Spaces:

englissi
/

engdialogue

Sleeping

App Files Files Community

englissi commited on Feb 4

Commit

9a60809

verified ·

1 Parent(s): 109b86f

Update app.py

Browse files

Files changed (1) hide show

app.py +59 -24

app.py CHANGED Viewed

@@ -3,51 +3,86 @@ from gtts import gTTS
 from pydub import AudioSegment
 from io import BytesIO
-# Step 1: Define a function to generate and merge TTS audio for multiple languages
-def multilingual_tts(korean_text, british_english_text, american_english_text):
-    # Language mapping
-    texts = {
-        "ko": korean_text,
-        "en-gb": british_english_text,  # British English
-        "en-us": american_english_text,  # American English
-    }
-    combined_audio = AudioSegment.silent(duration=0)  # Empty audio to start
-    for lang, text in texts.items():
-        if text.strip():  # Process only if text is provided
-            tld = 'co.uk' if lang == "en-gb" else 'com'
-            tts = gTTS(text, lang="en" if lang.startswith("en") else lang, tld=tld)
             audio_file = BytesIO()
             tts.write_to_fp(audio_file)
             audio_file.seek(0)
             tts_audio = AudioSegment.from_file(audio_file, format="mp3")
-            combined_audio += tts_audio + AudioSegment.silent(duration=500)  # Add silence between languages
-    # Save combined audio to a file
     output_file = "combined_output.mp3"
     combined_audio.export(output_file, format="mp3")
     return output_file
-# Step 2: Create Gradio interface
 with gr.Blocks() as demo:
-    gr.Markdown("## Multilingual TTS: Generate a Single Audio File")
     with gr.Row():
-        korean_input = gr.Textbox(label="Enter Korean Text:", placeholder="안녕하세요")
-        british_english_input = gr.Textbox(label="Enter British English Text:", placeholder="Hello (British)")
-        american_english_input = gr.Textbox(label="Enter American English Text:", placeholder="Hello (American)")
     output_audio = gr.Audio(label="Generated Speech", type="filepath")
     generate_button = gr.Button("Generate Speech")
     generate_button.click(
         multilingual_tts,
-        inputs=[korean_input, british_english_input, american_english_input],
         outputs=output_audio
     )
-# Run the app
 if __name__ == "__main__":
     demo.launch()

 from pydub import AudioSegment
 from io import BytesIO
+def multilingual_tts(
+    korean_text,
+    british_text,        # 기존 영국식 입력란
+    american_text,       # 기존 미국식 입력란
+    british_text_add1,   # 추가 영국식 입력란 1
+    british_text_add2,   # 추가 영국식 입력란 2
+    australian_text_add1, # 추가 호주식 입력란 1
+    australian_text_add2, # 추가 호주식 입력란 2
+    american_text_add1   # 추가 미국식 입력란 1
+):
+    # 각 음성에 대해 (언어 코드, tld, 텍스트) 튜플을 리스트에 저장합니다.
+    voices = [
+        ("ko", "com", korean_text),                      # 한국어
+        ("en", "co.uk", british_text),                   # 기존 영국식
+        ("en", "com", american_text),                    # 기존 미국식
+        ("en", "co.uk", british_text_add1),              # 추가 영국식 1
+        ("en", "co.uk", british_text_add2),              # 추가 영국식 2
+        ("en", "com.au", australian_text_add1),          # 추가 호주식 1
+        ("en", "com.au", australian_text_add2),          # 추가 호주식 2
+        ("en", "com", american_text_add1)                # 추가 미국식 1
+    ]
+    combined_audio = AudioSegment.silent(duration=0)  # 빈 오디오
+    for lang, tld, text in voices:
+        if text.strip():  # 텍스트가 입력되어 있을 때만 처리
+            tts = gTTS(text, lang=lang, tld=tld)
             audio_file = BytesIO()
             tts.write_to_fp(audio_file)
             audio_file.seek(0)
             tts_audio = AudioSegment.from_file(audio_file, format="mp3")
+            # 각 음성 사이에 500ms의 침묵 추가
+            combined_audio += tts_audio + AudioSegment.silent(duration=500)
+    # 최종 결합된 오디오를 mp3 파일로 저장
     output_file = "combined_output.mp3"
     combined_audio.export(output_file, format="mp3")
     return output_file
 with gr.Blocks() as demo:
+    gr.Markdown("## Multilingual TTS: Generate a Single Audio File (총 8개 음성)")
+    # 한국어 입력란
+    korean_input = gr.Textbox(label="Enter Korean Text:", placeholder="안녕하세요")
+    # 기존 영어 입력란 (영국, 미국)
+    with gr.Row():
+        british_input = gr.Textbox(label="Enter British English Text:", placeholder="Hello (British)")
+        american_input = gr.Textbox(label="Enter American English Text:", placeholder="Hello (American)")
+    # 추가 영어 입력란
+    with gr.Row():
+        british_input_add1 = gr.Textbox(label="Enter Additional British English Text 1:", placeholder="Hi there (British)")
+        british_input_add2 = gr.Textbox(label="Enter Additional British English Text 2:", placeholder="Good day (British)")
+    with gr.Row():
+        australian_input_add1 = gr.Textbox(label="Enter Additional Australian English Text 1:", placeholder="G'day (Australian)")
+        australian_input_add2 = gr.Textbox(label="Enter Additional Australian English Text 2:", placeholder="How ya going? (Australian)")
     with gr.Row():
+        american_input_add1 = gr.Textbox(label="Enter Additional American English Text:", placeholder="Hey (American)")
     output_audio = gr.Audio(label="Generated Speech", type="filepath")
     generate_button = gr.Button("Generate Speech")
     generate_button.click(
         multilingual_tts,
+        inputs=[
+            korean_input,
+            british_input,
+            american_input,
+            british_input_add1,
+            british_input_add2,
+            australian_input_add1,
+            australian_input_add2,
+            american_input_add1
+        ],
         outputs=output_audio
     )
 if __name__ == "__main__":
     demo.launch()