Spaces:

suprimedev
/

talk-dial

Running

App Files Files Community

suprimedev commited on Jun 8

Commit

7271ac7

verified ·

1 Parent(s): ad2dfc2

Update app.py

Browse files

Files changed (1) hide show

app.py +40 -79

app.py CHANGED Viewed

@@ -2,24 +2,19 @@ import gradio as gr
 from pydub import AudioSegment
 import requests
 import os
-import uuid
-import re
-import time # برای sleep در Polling
 # مسیر ذخیره فایل‌های موقت
 TEMP_DIR = "temp_audio"
 if not os.path.exists(TEMP_DIR):
     os.makedirs(TEMP_DIR)
-# تنظیمات Polling
-POLLING_INTERVAL_SECONDS = 2
-MAX_POLLING_ATTEMPTS = 30 # مثلاً 30 * 2 = 60 ثانیه صبر می‌کنیم
 def download_file(url, output_path):
     """فایل را از یک URL دانلود می‌کند."""
     try:
         response = requests.get(url, stream=True)
-        response.raise_for_status()
         with open(output_path, 'wb') as f:
             for chunk in response.iter_content(chunk_size=8192):
                 f.write(chunk)
@@ -39,14 +34,17 @@ def get_audio_from_input(input_source):
     unique_filename = os.path.join(TEMP_DIR, str(uuid.uuid4()))
     if input_source.startswith("http://") or input_source.startswith("https://"):
         file_extension = os.path.splitext(input_source.split('?')[0])[1]
-        if not file_extension:
             file_extension = ".mp3"
         temp_filepath = unique_filename + "_downloaded" + file_extension
         if not download_file(input_source, temp_filepath):
             return None, f"خطا در دانلود فایل از لینک: {input_source}"
         audio_path = temp_filepath
     else:
         audio_path = input_source
     try:
@@ -55,7 +53,10 @@ def get_audio_from_input(input_source):
     except Exception as e:
         return None, f"خطا در بارگذاری فایل صوتی ({audio_path}): {e}. مطمئن شوید فایل MP3 یا WAV معتبر است."
     finally:
         if 'temp_filepath' in locals() and os.path.exists(temp_filepath):
             try:
                 os.remove(temp_filepath)
             except OSError as e:
@@ -98,15 +99,14 @@ def tts_and_merge(text_input):
     if not text_input.strip():
         return None, "لطفاً متنی برای پردازش وارد کنید."
     lines = text_input.strip().split('\n')
     audio_urls_to_merge = []
     errors = []
-    # برای Gradio که بتواند در حین Polling وضعیت را نشان دهد
-    yield None, "در حال شروع پردازش TTS..."
-    for line_idx, line in enumerate(lines):
         match = re.match(r'^\s*\((\d+)\)(.*)$', line)
         if match:
             speaker_number = match.group(1)
@@ -116,87 +116,47 @@ def tts_and_merge(text_input):
                 errors.append(f"خطا: متن خالی برای گوینده {speaker_number} در خط '{line}'")
                 continue
-            # فرض: این Endpoint برای درخواست TTS و دریافت event_id است
-            # (ممکن است نیاز به تغییر به POST و body JSON داشته باشد)
-            tts_request_url = f"https://talkbot.ir/api/TTS-S{speaker_number}/request?text={requests.utils.quote(text_for_tts)}" # URL Encode text
-            yield None, f"در حال تولید صدا برای خط {line_idx+1} (گوینده {speaker_number})..."
             try:
-                # مرحله 1: ارسال درخواست TTS و دریافت event_id
-                response = requests.get(tts_request_url) # یا requests.post(...)
-                response.raise_for_status()
-                # فرض: پاسخ یک JSON با event_id است
-                response_data = response.json()
-                event_id = response_data.get("event_id")
-                if not event_id:
-                    errors.append(f"API برای گوینده {speaker_number} در خط {line_idx+1} یک event_id معتبر برنگرداند: {response.text}")
-                    continue
-                print(f"درخواست TTS برای {speaker_number} (خط {line_idx+1}) ارسال شد، Event ID: {event_id}")
-                # مرحله 2: Polling برای وضعیت
-                audio_link = None
-                polling_attempts = 0
-                while polling_attempts < MAX_POLLING_ATTEMPTS:
-                    polling_attempts += 1
-                    status_url = f"https://talkbot.ir/api/TTS-S{speaker_number}/status/{event_id}" # یا یک Endpoint کلی تر مثل /api/tts/status/{event_id}
-                    yield None, f"خط {line_idx+1} (گوینده {speaker_number}): در حال بررسی وضعیت (تلاش {polling_attempts}/{MAX_POLLING_ATTEMPTS})..."
-                    status_response = requests.get(status_url)
-                    status_response.raise_for_status()
-                    status_data = status_response.json()
-                    status = status_data.get("status")
-                    if status == "completed":
-                        audio_link = status_data.get("audio_url")
-                        if audio_link and audio_link.startswith("http"):
-                            audio_urls_to_merge.append(audio_link)
-                            print(f"صدا برای {speaker_number} (خط {line_idx+1}) آماده شد: {audio_link}")
-                            break # از حلقه Polling خارج می‌شویم
-                        else:
-                            errors.append(f"لینک صوتی نامعتبر در پاسخ وضعیت برای {speaker_number} (خط {line_idx+1}): {status_data}")
-                            break
-                    elif status == "failed":
-                        error_msg = status_data.get("error", "خطای ناشناخته از API.")
-                        errors.append(f"تولید صدا برای گوینده {speaker_number} (خط {line_idx+1}) با خطا مواجه شد: {error_msg}")
-                        break
-                    elif status == "processing":
-                        time.sleep(POLLING_INTERVAL_SECONDS)
-                    else:
-                        errors.append(f"وضعیت ناشناخته از API برای {speaker_number} (خط {line_idx+1}): {status_data}")
-                        break
-                if not audio_link: # اگر Polling به پایان رسید و لینکی دریافت نشد
-                    errors.append(f"تولید صدا برای گوینده {speaker_number} (خط {line_idx+1}) در زمان تعیین شده به اتمام نرسید یا لینکی دریافت نشد.")
             except requests.exceptions.RequestException as e:
-                errors.append(f"خطا در ارتباط با Talkbot API برای گوینده {speaker_number} (خط {line_idx+1}): {e}")
             except Exception as e:
-                errors.append(f"خطای غیرمنتظره در پردازش Talkbot API برای گوینده {speaker_number} (خط {line_idx+1}): {e}")
         else:
-            if line.strip():
                 errors.append(f"فرمت نامعتبر در خط: '{line}'. انتظار می‌رود (شماره)متن.")
     if not audio_urls_to_merge:
-        final_message = "هیچ فایل صوتی برای ادغام تولید نشد."
-        if errors:
-            final_message += "\n\nخطاهای رخ داده:\n" + "\n".join(errors)
-        yield None, final_message
-        return
-    yield None, "در حال ادغام فایل‌های صوتی..."
     merged_output_path, merge_message = merge_audio_files(audio_urls_to_merge)
     final_message = merge_message
     if errors:
         final_message += "\n\nخطاهای رخ داده:\n" + "\n".join(errors)
-    yield merged_output_path, final_message
 # ایجاد رابط کاربری Gradio
@@ -224,7 +184,7 @@ with gr.Blocks() as demo:
         merge_button = gr.Button("ادغام فایل‌های صوتی")
         merge_button.click(
-            fn=lambda x: merge_audio_files([s.strip() for s in x.split('\n') if s.strip()]),
             inputs=[audio_links_input],
             outputs=[audio_merge_output_audio, audio_merge_output_message]
         )
@@ -232,6 +192,8 @@ with gr.Blocks() as demo:
         gr.Examples(
             examples=[
                 ["https://www.soundhelix.com/examples/mp3/SoundHelix-Song-1.mp3\nhttps://www.soundhelix.com/examples/mp3/SoundHelix-Song-2.mp3"],
             ],
             inputs=audio_links_input,
             label="نمونه‌ها"
@@ -265,6 +227,5 @@ with gr.Blocks() as demo:
 if __name__ == "__main__":
-    demo.launch(debug=True, show_api=False, inline=False, share=True)
-    # برای اینکه Gradio بتواند خروجی‌های میانی (yield) را مدیریت کند، نیاز به queue دارید.
-    # demo.launch(share=True, enable_queue=True)

 from pydub import AudioSegment
 import requests
 import os
+import uuid # برای تولید نام فایل منحصر به فرد
+import re # برای تجزیه متن
 # مسیر ذخیره فایل‌های موقت
 TEMP_DIR = "temp_audio"
 if not os.path.exists(TEMP_DIR):
     os.makedirs(TEMP_DIR)
 def download_file(url, output_path):
     """فایل را از یک URL دانلود می‌کند."""
     try:
         response = requests.get(url, stream=True)
+        response.raise_for_status()  # خطایی رخ داد، آن را بالا ببر
         with open(output_path, 'wb') as f:
             for chunk in response.iter_content(chunk_size=8192):
                 f.write(chunk)
     unique_filename = os.path.join(TEMP_DIR, str(uuid.uuid4()))
     if input_source.startswith("http://") or input_source.startswith("https://"):
+        # این یک URL است، دانلودش کن
+        # سعی می کنیم پسوند فایل را از URL تشخیص دهیم، در غیر این صورت از .mp3 استفاده می کنیم.
         file_extension = os.path.splitext(input_source.split('?')[0])[1]
+        if not file_extension: # اگر پسوندی در URL نباشد (مثلا برای APIها)
             file_extension = ".mp3"
         temp_filepath = unique_filename + "_downloaded" + file_extension
         if not download_file(input_source, temp_filepath):
             return None, f"خطا در دانلود فایل از لینک: {input_source}"
         audio_path = temp_filepath
     else:
+        # فرض می‌شود یک مسیر فایل محلی است
         audio_path = input_source
     try:
     except Exception as e:
         return None, f"خطا در بارگذاری فایل صوتی ({audio_path}): {e}. مطمئن شوید فایل MP3 یا WAV معتبر است."
     finally:
+        # اگر فایل از URL دانلود شده بود، آن را پاک کن
         if 'temp_filepath' in locals() and os.path.exists(temp_filepath):
+            # اگر فایل بعداً توسط pydub پردازش و لود شده باشد، می‌توانیم آن را حذف کنیم.
+            # در غیر این صورت، ممکن است در حال استفاده باشد.
             try:
                 os.remove(temp_filepath)
             except OSError as e:
     if not text_input.strip():
         return None, "لطفاً متنی برای پردازش وارد کنید."
+    # الگو برای تشخیص شماره و متن پرانتزی: (شماره)متن
+    # این الگو همچنین newline را برای پردازش خط به خط در نظر می‌گیرد.
     lines = text_input.strip().split('\n')
     audio_urls_to_merge = []
     errors = []
+    for line in lines:
         match = re.match(r'^\s*\((\d+)\)(.*)$', line)
         if match:
             speaker_number = match.group(1)
                 errors.append(f"خطا: متن خالی برای گوینده {speaker_number} در خط '{line}'")
                 continue
+            # ساخت URL برای Talkbot API
+            # متن باید URL-encoded شود، اما requests.get این کار را به طور خودکار برای پارامترها انجام می‌دهد.
+            tts_url = f"https://talkbot.ir/api/TTS-S{speaker_number}?text={text_for_tts}"
+            print(f"درخواست TTS برای گوینده {speaker_number}: {tts_url}") # برای debugging
             try:
+                # درخواست به Talkbot API
+                response = requests.get(tts_url)
+                response.raise_for_status() # برای خطاهای HTTP
+                # فرض بر این است که پاسخ مستقیم لینک MP3 است
+                # اگر API لینک را در JSON برمی‌گرداند، باید آن را parse کنید.
+                # در مثال شما، فرض می‌شود پاسخ مستقیم لینک MP3 است.
+                audio_link = response.text.strip()
+                if audio_link.startswith("http"): # مطمئن شوید لینک معتبر است
+                    audio_urls_to_merge.append(audio_link)
+                else:
+                    errors.append(f"API برای گوینده {speaker_number} لینک معتبری برنگرداند: '{audio_link}'")
             except requests.exceptions.RequestException as e:
+                errors.append(f"خطا در ارتباط با Talkbot API برای گوینده {speaker_number}: {e}")
             except Exception as e:
+                errors.append(f"خطای غیرمنتظره در پردازش Talkbot API برای گوینده {speaker_number}: {e}")
         else:
+            if line.strip(): # اگر خط خالی نباشد، اما مطابق الگو نباشد
                 errors.append(f"فرمت نامعتبر در خط: '{line}'. انتظار می‌رود (شماره)متن.")
     if not audio_urls_to_merge:
+        return None, "هیچ فایل صوتی برای ادغام تولید نشد." + "\n".join(errors) if errors else ""
+    # حالا لینک‌های تولید شده را به تابع merge_audio_files اصلی می‌فرستیم
     merged_output_path, merge_message = merge_audio_files(audio_urls_to_merge)
     final_message = merge_message
     if errors:
         final_message += "\n\nخطاهای رخ داده:\n" + "\n".join(errors)
+    return merged_output_path, final_message
 # ایجاد رابط کاربری Gradio
         merge_button = gr.Button("ادغام فایل‌های صوتی")
         merge_button.click(
+            fn=lambda x: merge_audio_files([s.strip() for s in x.split('\n') if s.strip()]), # تبدیل ورودی رشته‌ای به لیست برای تابع
             inputs=[audio_links_input],
             outputs=[audio_merge_output_audio, audio_merge_output_message]
         )
         gr.Examples(
             examples=[
                 ["https://www.soundhelix.com/examples/mp3/SoundHelix-Song-1.mp3\nhttps://www.soundhelix.com/examples/mp3/SoundHelix-Song-2.mp3"],
+                # اگر فایل‌های واقعی داشته باشید، می‌توانید این خط را فعال کنید:
+                # ["./path/to/your/local_audio.mp3\n./path/to/another/local_audio.wav"]
             ],
             inputs=audio_links_input,
             label="نمونه‌ها"
 if __name__ == "__main__":
+    demo.launch() # برای اجرا در لوکال
+    # demo.launch(share=True) # برای اشتراک‌گذاری موقت در یک لینک عمومی (برای هوش مصنوعی)