Spaces:

2506minecraft
/

Arabic-Chatbot

Running

App Files Files Community

2506minecraft commited on Mar 5

Commit

5180e89

verified ·

1 Parent(s): eb07f0e

Update app.py

Browse files

Files changed (1) hide show

app.py +7 -11

app.py CHANGED Viewed

@@ -8,7 +8,7 @@ import soundfile as sf
 from pydub import AudioSegment
 from telegram import Update
 from telegram.ext import ApplicationBuilder, MessageHandler, filters, CommandHandler
-from transformers import pipeline, AutoTokenizer, VitsModel
 from huggingface_hub import login
 import asyncio
 from collections import defaultdict
@@ -33,12 +33,8 @@ try:
     )
     # 2. نموذج توليف الصوت (نموذج بديل)
-    tts_tokenizer = AutoTokenizer.from_pretrained(
-        "tts_models/arabic/arabic_tts",
-        token=os.getenv("HF_TOKEN")
-    )
-    tts_model = VitsModel.from_pretrained(
-        "tts_models/arabic/arabic_tts",
         token=os.getenv("HF_TOKEN")
     )
@@ -98,10 +94,10 @@ async def generate_response(text: str, user_id: str) -> str:
 async def text_to_speech(text: str) -> None:
     try:
-        inputs = tts_tokenizer(text, return_tensors="pt")
         with torch.no_grad():
-            output = tts_model(**inputs, speaker_id=0)  # اختيار الصوت الأنثوي
-        waveform = output.waveform[0].numpy()
         sf.write("bot_response.wav", waveform, tts_model.config.sampling_rate)
     except Exception as e:
         logger.error(f"فشل تحويل النص إلى صوت: {str(e)}")
@@ -118,7 +114,7 @@ async def process_voice(update: Update, context):
         user_text = await speech_to_text("user_voice.ogg")
         if not user_text:
-            await update.message.reply_text("لم أتمكن من فهم الصوت. يرجى المحاولة مرة أخرى.")
             return
         bot_response = await generate_response(user_text, str(user_id))

 from pydub import AudioSegment
 from telegram import Update
 from telegram.ext import ApplicationBuilder, MessageHandler, filters, CommandHandler
+from transformers import pipeline, AutoTokenizer, AutoModelForCausalLM
 from huggingface_hub import login
 import asyncio
 from collections import defaultdict
     )
     # 2. نموذج توليف الصوت (نموذج بديل)
+    tts_model = AutoModelForCausalLM.from_pretrained(
+        "coqui/tts-arabic",
         token=os.getenv("HF_TOKEN")
     )
 async def text_to_speech(text: str) -> None:
     try:
+        inputs = tts_model(text, return_tensors="pt")
         with torch.no_grad():
+            output = tts_model.generate(**inputs)
+        waveform = output[0].numpy()
         sf.write("bot_response.wav", waveform, tts_model.config.sampling_rate)
     except Exception as e:
         logger.error(f"فشل تحويل النص إلى صوت: {str(e)}")
         user_text = await speech_to_text("user_voice.ogg")
         if not user_text:
+            await update.message.reply_text(" لم أتمكن من فهم الصوت. يرجى المحاولة مرة أخرى.")
             return
         bot_response = await generate_response(user_text, str(user_id))