Spaces:

sudhanm
/

whisper-largev2-raw-ta-ml

Sleeping

App Files Files Community

sudhanm commited on 7 days ago

Commit

039f2f1

verified ·

1 Parent(s): df1ff92

Update app.py

Browse files

Files changed (1) hide show

app.py +6 -1

app.py CHANGED Viewed

@@ -17,6 +17,7 @@ import soundfile as sf
 from indic_transliteration import sanscript
 from indic_transliteration.sanscript import transliterate
 import warnings
 warnings.filterwarnings("ignore")
 # ---------------- CONFIG ---------------- #
@@ -87,6 +88,7 @@ SENTENCE_BANK = {
 # ---------------- MODEL CACHE ---------------- #
 asr_models = {}
 def load_asr_model(language):
     """Load ASR model for specific language - PRIMARY MODELS ONLY"""
     if language not in asr_models:
@@ -162,6 +164,7 @@ def preprocess_audio(audio_path, target_sr=16000):
         print(f"Audio preprocessing error: {e}")
         return None, None
 def transcribe_audio(audio_path, language, initial_prompt="", force_language=True):
     """Transcribe audio using loaded models"""
     try:
@@ -322,6 +325,7 @@ def get_pronunciation_score(wer_val, cer_val):
         return "💪 Keep Trying! (<40%)", "Don't give up! Practice makes perfect."
 # ---------------- MAIN FUNCTION ---------------- #
 def compare_pronunciation(audio, language_choice, intended_sentence):
     """Main function to compare pronunciation"""
     print(f"🔍 Starting analysis with language: {language_choice}")
@@ -543,8 +547,9 @@ if __name__ == "__main__":
     print("🚀 Starting Multilingual Pronunciation Trainer with LARGE models...")
     print(f"🔧 Device: {DEVICE}")
     print(f"🔧 PyTorch version: {torch.__version__}")
-    print("📦 Models will be loaded on-demand for best performance...")
     print("⚡ Using AI4Bharat LARGE models for maximum accuracy!")
     demo = create_interface()
     demo.launch(

 from indic_transliteration import sanscript
 from indic_transliteration.sanscript import transliterate
 import warnings
+import spaces
 warnings.filterwarnings("ignore")
 # ---------------- CONFIG ---------------- #
 # ---------------- MODEL CACHE ---------------- #
 asr_models = {}
+@spaces.GPU
 def load_asr_model(language):
     """Load ASR model for specific language - PRIMARY MODELS ONLY"""
     if language not in asr_models:
         print(f"Audio preprocessing error: {e}")
         return None, None
+@spaces.GPU
 def transcribe_audio(audio_path, language, initial_prompt="", force_language=True):
     """Transcribe audio using loaded models"""
     try:
         return "💪 Keep Trying! (<40%)", "Don't give up! Practice makes perfect."
 # ---------------- MAIN FUNCTION ---------------- #
+@spaces.GPU
 def compare_pronunciation(audio, language_choice, intended_sentence):
     """Main function to compare pronunciation"""
     print(f"🔍 Starting analysis with language: {language_choice}")
     print("🚀 Starting Multilingual Pronunciation Trainer with LARGE models...")
     print(f"🔧 Device: {DEVICE}")
     print(f"🔧 PyTorch version: {torch.__version__}")
+    print("📦 Models will be loaded on-demand with GPU acceleration...")
     print("⚡ Using AI4Bharat LARGE models for maximum accuracy!")
+    print("🎮 GPU functions decorated with @spaces.GPU for HuggingFace Spaces")
     demo = create_interface()
     demo.launch(