Spaces:

Futuresony
/

Speech-recognition

Sleeping

Futuresony commited on Feb 10

Commit

07c5b0a

verified ·

1 Parent(s): 89fc18c

Update asr.py

Files changed (1) hide show

asr.py CHANGED Viewed

@@ -1,3 +1,14 @@
 model = Wav2Vec2ForCTC.from_pretrained(MODEL_ID)
 model.eval()
@@ -46,4 +57,4 @@ def transcribe_auto(audio_data=None):
         final_transcription = processor.decode(ids)
     return f"Detected Language: {detect
-ed_lang.upper()}\n\nTranscription:\n{final_transcription}"

+import librosa
+import torch
+import numpy as np
+import langid  # Language detection library
+from transformers import Wav2Vec2ForCTC, AutoProcessor
+ASR_SAMPLING_RATE = 16_000
+MODEL_ID = "facebook/mms-1b-all"
+# Load MMS Model
+processor = AutoProcessor.from_pretrained(MODEL_ID)
 model = Wav2Vec2ForCTC.from_pretrained(MODEL_ID)
 model.eval()
         final_transcription = processor.decode(ids)
     return f"Detected Language: {detect
+ed_lang.upper()}\n\nTranscription:\n{final_transcription}"