Spaces:

suprimedev
/

talk-dial

Running

App Files Files Community

suprimedev commited on Jun 8

Commit

ad2dfc2

verified ·

1 Parent(s): 1c4f949

Update app.py

Browse files

Files changed (1) hide show

app.py +79 -41

app.py CHANGED Viewed

@@ -2,19 +2,24 @@ import gradio as gr
 from pydub import AudioSegment
 import requests
 import os
-import uuid # برای تولید نام فایل منحصر به فرد
-import re # برای تجزیه متن
 # مسیر ذخیره فایل‌های موقت
 TEMP_DIR = "temp_audio"
 if not os.path.exists(TEMP_DIR):
     os.makedirs(TEMP_DIR)
 def download_file(url, output_path):
     """فایل را از یک URL دانلود می‌کند."""
     try:
         response = requests.get(url, stream=True)
-        response.raise_for_status()  # خطایی رخ داد، آن را بالا ببر
         with open(output_path, 'wb') as f:
             for chunk in response.iter_content(chunk_size=8192):
                 f.write(chunk)
@@ -34,17 +39,14 @@ def get_audio_from_input(input_source):
     unique_filename = os.path.join(TEMP_DIR, str(uuid.uuid4()))
     if input_source.startswith("http://") or input_source.startswith("https://"):
-        # این یک URL است، دانلودش کن
-        # سعی می کنیم پسوند فایل را از URL تشخیص دهیم، در غیر این صورت از .mp3 استفاده می کنیم.
         file_extension = os.path.splitext(input_source.split('?')[0])[1]
-        if not file_extension: # اگر پسوندی در URL نباشد (مثلا برای APIها)
             file_extension = ".mp3"
         temp_filepath = unique_filename + "_downloaded" + file_extension
         if not download_file(input_source, temp_filepath):
             return None, f"خطا در دانلود فایل از لینک: {input_source}"
         audio_path = temp_filepath
     else:
-        # فرض می‌شود یک مسیر فایل محلی است
         audio_path = input_source
     try:
@@ -53,10 +55,7 @@ def get_audio_from_input(input_source):
     except Exception as e:
         return None, f"خطا در بارگذاری فایل صوتی ({audio_path}): {e}. مطمئن شوید فایل MP3 یا WAV معتبر است."
     finally:
-        # اگر فایل از URL دانلود شده بود، آن را پاک کن
         if 'temp_filepath' in locals() and os.path.exists(temp_filepath):
-            # اگر فایل بعداً توسط pydub پردازش و لود شده باشد، می‌توانیم آن را حذف کنیم.
-            # در غیر این صورت، ممکن است در حال استفاده باشد.
             try:
                 os.remove(temp_filepath)
             except OSError as e:
@@ -99,14 +98,15 @@ def tts_and_merge(text_input):
     if not text_input.strip():
         return None, "لطفاً متنی برای پردازش وارد کنید."
-    # الگو برای تشخیص شماره و متن پرانتزی: (شماره)متن
-    # این الگو همچنین newline را برای پردازش خط به خط در نظر می‌گیرد.
     lines = text_input.strip().split('\n')
     audio_urls_to_merge = []
     errors = []
-    for line in lines:
         match = re.match(r'^\s*\((\d+)\)(.*)$', line)
         if match:
             speaker_number = match.group(1)
@@ -116,47 +116,87 @@ def tts_and_merge(text_input):
                 errors.append(f"خطا: متن خالی برای گوینده {speaker_number} در خط '{line}'")
                 continue
-            # ساخت URL برای Talkbot API
-            # متن باید URL-encoded شود، اما requests.get این کار را به طور خودکار برای پارامترها انجام می‌دهد.
-            tts_url = f"https://talkbot.ir/api/TTS-S{speaker_number}?text={text_for_tts}"
-            print(f"درخواست TTS برای گوینده {speaker_number}: {tts_url}") # برای debugging
             try:
-                # درخواست به Talkbot API
-                response = requests.get(tts_url)
-                response.raise_for_status() # برای خطاهای HTTP
-                # فرض بر این است که پاسخ مستقیم لینک MP3 است
-                # اگر API لینک را در JSON برمی‌گرداند، باید آن را parse کنید.
-                # در مثال شما، فرض می‌شود پاسخ مستقیم لینک MP3 است.
-                audio_link = response.text.strip()
-                if audio_link.startswith("http"): # مطمئن شوید لینک معتبر است
-                    audio_urls_to_merge.append(audio_link)
-                else:
-                    errors.append(f"API برای گوینده {speaker_number} لینک معتبری برنگرداند: '{audio_link}'")
             except requests.exceptions.RequestException as e:
-                errors.append(f"خطا در ارتباط با Talkbot API برای گوینده {speaker_number}: {e}")
             except Exception as e:
-                errors.append(f"خطای غیرمنتظره در پردازش Talkbot API برای گوینده {speaker_number}: {e}")
         else:
-            if line.strip(): # اگر خط خالی نباشد، اما مطابق الگو نباشد
                 errors.append(f"فرمت نامعتبر در خط: '{line}'. انتظار می‌رود (شماره)متن.")
     if not audio_urls_to_merge:
-        return None, "هیچ فایل صوتی برای ادغام تولید نشد." + "\n".join(errors) if errors else ""
-    # حالا لینک‌های تولید شده را به تابع merge_audio_files اصلی می‌فرستیم
     merged_output_path, merge_message = merge_audio_files(audio_urls_to_merge)
     final_message = merge_message
     if errors:
         final_message += "\n\nخطاهای رخ داده:\n" + "\n".join(errors)
-    return merged_output_path, final_message
 # ایجاد رابط کاربری Gradio
@@ -184,7 +224,7 @@ with gr.Blocks() as demo:
         merge_button = gr.Button("ادغام فایل‌های صوتی")
         merge_button.click(
-            fn=lambda x: merge_audio_files([s.strip() for s in x.split('\n') if s.strip()]), # تبدیل ورودی رشته‌ای به لیست برای تابع
             inputs=[audio_links_input],
             outputs=[audio_merge_output_audio, audio_merge_output_message]
         )
@@ -192,8 +232,6 @@ with gr.Blocks() as demo:
         gr.Examples(
             examples=[
                 ["https://www.soundhelix.com/examples/mp3/SoundHelix-Song-1.mp3\nhttps://www.soundhelix.com/examples/mp3/SoundHelix-Song-2.mp3"],
-                # اگر فایل‌های واقعی داشته باشید، می‌توانید این خط را فعال کنید:
-                # ["./path/to/your/local_audio.mp3\n./path/to/another/local_audio.wav"]
             ],
             inputs=audio_links_input,
             label="نمونه‌ها"
@@ -227,6 +265,6 @@ with gr.Blocks() as demo:
 if __name__ == "__main__":
-    demo.launch() # برای اجرا در لوکال
-    # demo.launch(share=True) # برای اشتراک‌گذاری موقت در یک لینک عمومی (برای هوش مصنوعی)

 from pydub import AudioSegment
 import requests
 import os
+import uuid
+import re
+import time # برای sleep در Polling
 # مسیر ذخیره فایل‌های موقت
 TEMP_DIR = "temp_audio"
 if not os.path.exists(TEMP_DIR):
     os.makedirs(TEMP_DIR)
+# تنظیمات Polling
+POLLING_INTERVAL_SECONDS = 2
+MAX_POLLING_ATTEMPTS = 30 # مثلاً 30 * 2 = 60 ثانیه صبر می‌کنیم
 def download_file(url, output_path):
     """فایل را از یک URL دانلود می‌کند."""
     try:
         response = requests.get(url, stream=True)
+        response.raise_for_status()
         with open(output_path, 'wb') as f:
             for chunk in response.iter_content(chunk_size=8192):
                 f.write(chunk)
     unique_filename = os.path.join(TEMP_DIR, str(uuid.uuid4()))
     if input_source.startswith("http://") or input_source.startswith("https://"):
         file_extension = os.path.splitext(input_source.split('?')[0])[1]
+        if not file_extension:
             file_extension = ".mp3"
         temp_filepath = unique_filename + "_downloaded" + file_extension
         if not download_file(input_source, temp_filepath):
             return None, f"خطا در دانلود فایل از لینک: {input_source}"
         audio_path = temp_filepath
     else:
         audio_path = input_source
     try:
     except Exception as e:
         return None, f"خطا در بارگذاری فایل صوتی ({audio_path}): {e}. مطمئن شوید فایل MP3 یا WAV معتبر است."
     finally:
         if 'temp_filepath' in locals() and os.path.exists(temp_filepath):
             try:
                 os.remove(temp_filepath)
             except OSError as e:
     if not text_input.strip():
         return None, "لطفاً متنی برای پردازش وارد کنید."
     lines = text_input.strip().split('\n')
     audio_urls_to_merge = []
     errors = []
+    # برای Gradio که بتواند در حین Polling وضعیت را نشان دهد
+    yield None, "در حال شروع پردازش TTS..."
+    for line_idx, line in enumerate(lines):
         match = re.match(r'^\s*\((\d+)\)(.*)$', line)
         if match:
             speaker_number = match.group(1)
                 errors.append(f"خطا: متن خالی برای گوینده {speaker_number} در خط '{line}'")
                 continue
+            # فرض: این Endpoint برای درخواست TTS و دریافت event_id است
+            # (ممکن است نیاز به تغییر به POST و body JSON داشته باشد)
+            tts_request_url = f"https://talkbot.ir/api/TTS-S{speaker_number}/request?text={requests.utils.quote(text_for_tts)}" # URL Encode text
+            yield None, f"در حال تولید صدا برای خط {line_idx+1} (گوینده {speaker_number})..."
             try:
+                # مرحله 1: ارسال درخواست TTS و دریافت event_id
+                response = requests.get(tts_request_url) # یا requests.post(...)
+                response.raise_for_status()
+                # فرض: پاسخ یک JSON با event_id است
+                response_data = response.json()
+                event_id = response_data.get("event_id")
+                if not event_id:
+                    errors.append(f"API برای گوینده {speaker_number} در خط {line_idx+1} یک event_id معتبر برنگرداند: {response.text}")
+                    continue
+                print(f"درخواست TTS برای {speaker_number} (خط {line_idx+1}) ارسال شد، Event ID: {event_id}")
+                # مرحله 2: Polling برای وضعیت
+                audio_link = None
+                polling_attempts = 0
+                while polling_attempts < MAX_POLLING_ATTEMPTS:
+                    polling_attempts += 1
+                    status_url = f"https://talkbot.ir/api/TTS-S{speaker_number}/status/{event_id}" # یا یک Endpoint کلی تر مثل /api/tts/status/{event_id}
+                    yield None, f"خط {line_idx+1} (گوینده {speaker_number}): در حال بررسی وضعیت (تلاش {polling_attempts}/{MAX_POLLING_ATTEMPTS})..."
+                    status_response = requests.get(status_url)
+                    status_response.raise_for_status()
+                    status_data = status_response.json()
+                    status = status_data.get("status")
+                    if status == "completed":
+                        audio_link = status_data.get("audio_url")
+                        if audio_link and audio_link.startswith("http"):
+                            audio_urls_to_merge.append(audio_link)
+                            print(f"صدا برای {speaker_number} (خط {line_idx+1}) آماده شد: {audio_link}")
+                            break # از حلقه Polling خارج می‌شویم
+                        else:
+                            errors.append(f"لینک صوتی نامعتبر در پاسخ وضعیت برای {speaker_number} (خط {line_idx+1}): {status_data}")
+                            break
+                    elif status == "failed":
+                        error_msg = status_data.get("error", "خطای ناشناخته از API.")
+                        errors.append(f"تولید صدا برای گوینده {speaker_number} (خط {line_idx+1}) با خطا مواجه شد: {error_msg}")
+                        break
+                    elif status == "processing":
+                        time.sleep(POLLING_INTERVAL_SECONDS)
+                    else:
+                        errors.append(f"وضعیت ناشناخته از API برای {speaker_number} (خط {line_idx+1}): {status_data}")
+                        break
+                if not audio_link: # اگر Polling به پایان رسید و لینکی دریافت نشد
+                    errors.append(f"تولید صدا برای گوینده {speaker_number} (خط {line_idx+1}) در زمان تعیین شده به اتمام نرسید یا لینکی دریافت نشد.")
             except requests.exceptions.RequestException as e:
+                errors.append(f"خطا در ارتباط با Talkbot API برای گوینده {speaker_number} (خط {line_idx+1}): {e}")
             except Exception as e:
+                errors.append(f"خطای غیرمنتظره در پردازش Talkbot API برای گوینده {speaker_number} (خط {line_idx+1}): {e}")
         else:
+            if line.strip():
                 errors.append(f"فرمت نامعتبر در خط: '{line}'. انتظار می‌رود (شماره)متن.")
     if not audio_urls_to_merge:
+        final_message = "هیچ فایل صوتی برای ادغام تولید نشد."
+        if errors:
+            final_message += "\n\nخطاهای رخ داده:\n" + "\n".join(errors)
+        yield None, final_message
+        return
+    yield None, "در حال ادغام فایل‌های صوتی..."
     merged_output_path, merge_message = merge_audio_files(audio_urls_to_merge)
     final_message = merge_message
     if errors:
         final_message += "\n\nخطاهای رخ داده:\n" + "\n".join(errors)
+    yield merged_output_path, final_message
 # ایجاد رابط کاربری Gradio
         merge_button = gr.Button("ادغام فایل‌های صوتی")
         merge_button.click(
+            fn=lambda x: merge_audio_files([s.strip() for s in x.split('\n') if s.strip()]),
             inputs=[audio_links_input],
             outputs=[audio_merge_output_audio, audio_merge_output_message]
         )
         gr.Examples(
             examples=[
                 ["https://www.soundhelix.com/examples/mp3/SoundHelix-Song-1.mp3\nhttps://www.soundhelix.com/examples/mp3/SoundHelix-Song-2.mp3"],
             ],
             inputs=audio_links_input,
             label="نمونه‌ها"
 if __name__ == "__main__":
+    demo.launch(debug=True, show_api=False, inline=False, share=True)
+    # برای اینکه Gradio بتواند خروجی‌های میانی (yield) را مدیریت کند، نیاز به queue دارید.
+    # demo.launch(share=True, enable_queue=True)