Spaces:

suprimedev
/

talk-dial

Running

App Files Files Community

suprimedev commited on Jun 9

Commit

ba6b9e4

verified ·

1 Parent(s): 7271ac7

Update app.py

Browse files

Files changed (1) hide show

app.py +78 -52

app.py CHANGED Viewed

@@ -2,8 +2,8 @@ import gradio as gr
 from pydub import AudioSegment
 import requests
 import os
-import uuid # برای تولید نام فایل منحصر به فرد
-import re # برای تجزیه متن
 # مسیر ذخیره فایل‌های موقت
 TEMP_DIR = "temp_audio"
@@ -14,7 +14,7 @@ def download_file(url, output_path):
     """فایل را از یک URL دانلود می‌کند."""
     try:
         response = requests.get(url, stream=True)
-        response.raise_for_status()  # خطایی رخ داد، آن را بالا ببر
         with open(output_path, 'wb') as f:
             for chunk in response.iter_content(chunk_size=8192):
                 f.write(chunk)
@@ -27,24 +27,18 @@ def download_file(url, output_path):
         return False
 def get_audio_from_input(input_source):
-    """
-    منبع ورودی را پردازش کرده و یک شی AudioSegment برمی‌گرداند.
-    می‌تواند یک فایل محلی یا یک URL باشد.
-    """
     unique_filename = os.path.join(TEMP_DIR, str(uuid.uuid4()))
     if input_source.startswith("http://") or input_source.startswith("https://"):
-        # این یک URL است، دانلودش کن
-        # سعی می کنیم پسوند فایل را از URL تشخیص دهیم، در غیر این صورت از .mp3 استفاده می کنیم.
         file_extension = os.path.splitext(input_source.split('?')[0])[1]
-        if not file_extension: # اگر پسوندی در URL نباشد (مثلا برای APIها)
-            file_extension = ".mp3"
         temp_filepath = unique_filename + "_downloaded" + file_extension
         if not download_file(input_source, temp_filepath):
             return None, f"خطا در دانلود فایل از لینک: {input_source}"
         audio_path = temp_filepath
     else:
-        # فرض می‌شود یک مسیر فایل محلی است
         audio_path = input_source
     try:
@@ -53,21 +47,14 @@ def get_audio_from_input(input_source):
     except Exception as e:
         return None, f"خطا در بارگذاری فایل صوتی ({audio_path}): {e}. مطمئن شوید فایل MP3 یا WAV معتبر است."
     finally:
-        # اگر فایل از URL دانلود شده بود، آن را پاک کن
         if 'temp_filepath' in locals() and os.path.exists(temp_filepath):
-            # اگر فایل بعداً توسط pydub پردازش و لود شده باشد، می‌توانیم آن را حذف کنیم.
-            # در غیر این صورت، ممکن است در حال استفاده باشد.
             try:
                 os.remove(temp_filepath)
             except OSError as e:
                 print(f"Error removing temporary file {temp_filepath}: {e}")
 def merge_audio_files(input_sources):
-    """
-    چندین فایل صوتی را (از لینک یا فایل) ادغام می‌کند و یک فایل MP3 خروجی می‌دهد.
-    input_sources: یک لیست از URLها یا مسیرهای فایل‌ها.
-    """
     if not input_sources:
         return None, "لیست ورودی‌های صوتی خالی است."
@@ -80,7 +67,7 @@ def merge_audio_files(input_sources):
             combined_audio += audio_segment
         else:
             errors.append(error)
-            print(f"Skipping {source} due to error: {error}") # برای debugging کنسول
     if not combined_audio.duration_seconds > 0:
         return None, "هیچ فایل صوتی معتبری برای ادغام پیدا نشد. " + "\n".join(errors) if errors else ""
@@ -92,15 +79,48 @@ def merge_audio_files(input_sources):
     except Exception as e:
         return None, f"خطا در ذخیره فایل خروجی: {e}"
-def tts_and_merge(text_input):
-    """
-    متن ورودی را تجزیه می‌کند، با Talkbot API صدا تولید می‌کند و سپس آن‌ها را ادغام می‌کند.
-    """
     if not text_input.strip():
         return None, "لطفاً متنی برای پردازش وارد کنید."
-    # الگو برای تشخیص شماره و متن پرانتزی: (شماره)متن
-    # این الگو همچنین newline را برای پردازش خط به خط در نظر می‌گیرد.
     lines = text_input.strip().split('\n')
     audio_urls_to_merge = []
@@ -117,22 +137,16 @@ def tts_and_merge(text_input):
                 continue
             # ساخت URL برای Talkbot API
-            # متن باید URL-encoded شود، اما requests.get این کار را به طور خودکار برای پارامترها انجام می‌دهد.
             tts_url = f"https://talkbot.ir/api/TTS-S{speaker_number}?text={text_for_tts}"
-            print(f"درخواست TTS برای گوینده {speaker_number}: {tts_url}") # برای debugging
             try:
-                # درخواست به Talkbot API
                 response = requests.get(tts_url)
-                response.raise_for_status() # برای خطاهای HTTP
-                # فرض بر این است که پاسخ مستقیم لینک MP3 است
-                # اگر API لینک را در JSON برمی‌گرداند، باید آن را parse کنید.
-                # در مثال شما، فرض می‌شود پاسخ مستقیم لینک MP3 است.
-                audio_link = response.text.strip()
-                if audio_link.startswith("http"): # مطمئن شوید لینک معتبر است
                     audio_urls_to_merge.append(audio_link)
                 else:
                     errors.append(f"API برای گوینده {speaker_number} لینک معتبری برنگرداند: '{audio_link}'")
@@ -142,22 +156,37 @@ def tts_and_merge(text_input):
             except Exception as e:
                 errors.append(f"خطای غیرمنتظره در پردازش Talkbot API برای گوینده {speaker_number}: {e}")
         else:
-            if line.strip(): # اگر خط خالی نباشد، اما مطابق الگو نباشد
                 errors.append(f"فرمت نامعتبر در خط: '{line}'. انتظار می‌رود (شماره)متن.")
     if not audio_urls_to_merge:
         return None, "هیچ فایل صوتی برای ادغام تولید نشد." + "\n".join(errors) if errors else ""
-    # حالا لینک‌های تولید شده را به تابع merge_audio_files اصلی می‌فرستیم
-    merged_output_path, merge_message = merge_audio_files(audio_urls_to_merge)
-    final_message = merge_message
-    if errors:
-        final_message += "\n\nخطاهای رخ داده:\n" + "\n".join(errors)
-    return merged_output_path, final_message
 # ایجاد رابط کاربری Gradio
 with gr.Blocks() as demo:
@@ -184,7 +213,7 @@ with gr.Blocks() as demo:
         merge_button = gr.Button("ادغام فایل‌های صوتی")
         merge_button.click(
-            fn=lambda x: merge_audio_files([s.strip() for s in x.split('\n') if s.strip()]), # تبدیل ورودی رشته‌ای به لیست برای تابع
             inputs=[audio_links_input],
             outputs=[audio_merge_output_audio, audio_merge_output_message]
         )
@@ -192,8 +221,6 @@ with gr.Blocks() as demo:
         gr.Examples(
             examples=[
                 ["https://www.soundhelix.com/examples/mp3/SoundHelix-Song-1.mp3\nhttps://www.soundhelix.com/examples/mp3/SoundHelix-Song-2.mp3"],
-                # اگر فایل‌های واقعی داشته باشید، می‌توانید این خط را فعال کنید:
-                # ["./path/to/your/local_audio.mp3\n./path/to/another/local_audio.wav"]
             ],
             inputs=audio_links_input,
             label="نمونه‌ها"
@@ -211,7 +238,7 @@ with gr.Blocks() as demo:
         tts_merge_button = gr.Button("تولید و ادغام صدا")
         tts_merge_button.click(
-            fn=tts_and_merge,
             inputs=[tts_text_input],
             outputs=[tts_output_audio, tts_output_message]
         )
@@ -225,7 +252,6 @@ with gr.Blocks() as demo:
             label="نمونه‌ها"
         )
 if __name__ == "__main__":
-    demo.launch() # برای اجرا در لوکال
-    # demo.launch(share=True) # برای اشتراک‌گذاری موقت در یک لینک عمومی (برای هوش مصنوعی)

 from pydub import AudioSegment
 import requests
 import os
+import uuid
+import re
 # مسیر ذخیره فایل‌های موقت
 TEMP_DIR = "temp_audio"
     """فایل را از یک URL دانلود می‌کند."""
     try:
         response = requests.get(url, stream=True)
+        response.raise_for_status()
         with open(output_path, 'wb') as f:
             for chunk in response.iter_content(chunk_size=8192):
                 f.write(chunk)
         return False
 def get_audio_from_input(input_source):
+    """منبع ورودی را پردازش کرده و یک شی AudioSegment برمی‌گرداند."""
     unique_filename = os.path.join(TEMP_DIR, str(uuid.uuid4()))
     if input_source.startswith("http://") or input_source.startswith("https://"):
         file_extension = os.path.splitext(input_source.split('?')[0])[1]
+        if not file_extension:
+            file_extension = ".mp3"
         temp_filepath = unique_filename + "_downloaded" + file_extension
         if not download_file(input_source, temp_filepath):
             return None, f"خطا در دانلود فایل از لینک: {input_source}"
         audio_path = temp_filepath
     else:
         audio_path = input_source
     try:
     except Exception as e:
         return None, f"خطا در بارگذاری فایل صوتی ({audio_path}): {e}. مطمئن شوید فایل MP3 یا WAV معتبر است."
     finally:
         if 'temp_filepath' in locals() and os.path.exists(temp_filepath):
             try:
                 os.remove(temp_filepath)
             except OSError as e:
                 print(f"Error removing temporary file {temp_filepath}: {e}")
 def merge_audio_files(input_sources):
+    """چندین فایل صوتی را ادغام می‌کند و یک فایل MP3 خروجی می‌دهد."""
     if not input_sources:
         return None, "لیست ورودی‌های صوتی خالی است."
             combined_audio += audio_segment
         else:
             errors.append(error)
+            print(f"Skipping {source} due to error: {error}")
     if not combined_audio.duration_seconds > 0:
         return None, "هیچ فایل صوتی معتبری برای ادغام پیدا نشد. " + "\n".join(errors) if errors else ""
     except Exception as e:
         return None, f"خطا در ذخیره فایل خروجی: {e}"
+def add_intro_outro_and_background(podcast_audio, intro_audio_url, background_audio_url, outro_audio_url):
+    """افکت‌های صوتی را به پادکست اضافه می‌کند."""
+    # دانلود صدای ابتدایی (intro)
+    intro_audio, _ = get_audio_from_input(intro_audio_url)
+    if not intro_audio:
+        return None, "خطا در دانلود یا بارگذاری صدای ابتدایی"
+    # دانلود موزیک پس‌زمینه
+    background_audio, _ = get_audio_from_input(background_audio_url)
+    if not background_audio:
+        return None, "خطا در دانلود یا بارگذاری موزیک پس‌زمینه"
+    # دانلود صدای انتهایی (outro)
+    outro_audio, _ = get_audio_from_input(outro_audio_url)
+    if not outro_audio:
+        return None, "خطا در دانلود یا بارگذاری صدای انتهایی"
+    # طول پادکست اصلی
+    podcast_duration = len(podcast_audio)
+    # اضافه کردن صدای ابتدایی
+    final_audio = intro_audio
+    # اضافه کردن موزیک پس‌زمینه
+    background_audio = background_audio[:podcast_duration + 2000]  # موزیک به اندازه پادکست + 2 ثانیه
+    background_audio = background_audio.fade_in(2000).fade_out(2000)  # fade-in و fade-out
+    final_audio = final_audio.overlay(background_audio, position=0)  # موزیک پس‌زمینه از ابتدا شروع می‌شود
+    # اضافه کردن پادکست اصلی
+    final_audio = final_audio + podcast_audio
+    # اضافه کردن صدای انتهایی
+    final_audio = final_audio + outro_audio
+    return final_audio, None
+def tts_and_merge_with_effects(text_input):
+    """متن ورودی را پردازش کرده و فایل صوتی با افکت‌های صوتی تولید می‌کند."""
     if not text_input.strip():
         return None, "لطفاً متنی برای پردازش وارد کنید."
+    # تجزیه متن و تولید پادکست اصلی
     lines = text_input.strip().split('\n')
     audio_urls_to_merge = []
                 continue
             # ساخت URL برای Talkbot API
             tts_url = f"https://talkbot.ir/api/TTS-S{speaker_number}?text={text_for_tts}"
+            print(f"درخواست TTS برای گوینده {speaker_number}: {tts_url}")
             try:
                 response = requests.get(tts_url)
+                response.raise_for_status()
+                audio_link = response.text.strip()
+                if audio_link.startswith("http"):
                     audio_urls_to_merge.append(audio_link)
                 else:
                     errors.append(f"API برای گوینده {speaker_number} لینک معتبری برنگرداند: '{audio_link}'")
             except Exception as e:
                 errors.append(f"خطای غیرمنتظره در پردازش Talkbot API برای گوینده {speaker_number}: {e}")
         else:
+            if line.strip():
                 errors.append(f"فرمت نامعتبر در خط: '{line}'. انتظار می‌رود (شماره)متن.")
     if not audio_urls_to_merge:
         return None, "هیچ فایل صوتی برای ادغام تولید نشد." + "\n".join(errors) if errors else ""
+    # ادغام فایل‌های صوتی تولید شده
+    podcast_audio_path, merge_message = merge_audio_files(audio_urls_to_merge)
+    if not podcast_audio_path:
+        return None, merge_message
+    # بارگذاری پادکست اصلی
+    podcast_audio = AudioSegment.from_file(podcast_audio_path)
+    # افزودن افکت‌های صوتی
+    final_audio, error = add_intro_outro_and_background(
+        podcast_audio,
+        intro_audio_url="https://talkbot.ir/example/effect-podcast/wk.mp3",
+        background_audio_url="https://example.com/path/to/background_music.mp3",  # مسیر موزیک پس‌زمینه
+        outro_audio_url="https://talkbot.ir/example/effect-podcast/outro.mp3"  # مسیر صدای انتهایی
+    )
+    if not final_audio:
+        return None, error
+    # ذخیره فایل نهایی
+    output_filename = os.path.join(TEMP_DIR, f"final_podcast_{uuid.uuid4()}.mp3")
+    try:
+        final_audio.export(output_filename, format="mp3")
+        return output_filename, "پادکست با افکت‌های صوتی با موفقیت تولید شد!"
+    except Exception as e:
+        return None, f"خطا در ذخیره پادکست نهایی: {e}"
 # ایجاد رابط کاربری Gradio
 with gr.Blocks() as demo:
         merge_button = gr.Button("ادغام فایل‌های صوتی")
         merge_button.click(
+            fn=lambda x: merge_audio_files([s.strip() for s in x.split('\n') if s.strip()]),
             inputs=[audio_links_input],
             outputs=[audio_merge_output_audio, audio_merge_output_message]
         )
         gr.Examples(
             examples=[
                 ["https://www.soundhelix.com/examples/mp3/SoundHelix-Song-1.mp3\nhttps://www.soundhelix.com/examples/mp3/SoundHelix-Song-2.mp3"],
             ],
             inputs=audio_links_input,
             label="نمونه‌ها"
         tts_merge_button = gr.Button("تولید و ادغام صدا")
         tts_merge_button.click(
+            fn=tts_and_merge_with_effects,
             inputs=[tts_text_input],
             outputs=[tts_output_audio, tts_output_message]
         )
             label="نمونه‌ها"
         )
 if __name__ == "__main__":
+    demo.launch()  # برای اجرا در لوکال
+    # demo.launch(share=True)  # برای اشتراک‌گذاری موقت در یک لینک عمومی