Spaces:

Futuresony
/

Speech-recognition

Sleeping

Futuresony commited on Feb 11

Commit

e758b0c

verified ·

1 Parent(s): 8788e6c

Update asr.py

Files changed (1) hide show

asr.py CHANGED Viewed

@@ -4,11 +4,11 @@ import numpy as np
 import langid  # Language detection library
 from transformers import Wav2Vec2ForCTC, AutoProcessor
-#ASR_SAMPLING_RATE = 16_000
-#MODEL_ID = "facebook/mms-1b-all"
-# openai/whisper-large-v3-turbo
 ASR_SAMPLING_RATE = 16_000
-MODEL_ID = "openai/whisper-large-v3-turbo"
 # Load MMS Model
 processor = AutoProcessor.from_pretrained(MODEL_ID)
@@ -59,4 +59,5 @@ def transcribe_auto(audio_data=None):
         ids = torch.argmax(outputs, dim=-1)[0]
         final_transcription = processor.decode(ids)
-    return f"Detected Language: {detected_lang.upper()}\n\nTranscription:\n{final_transcription}"

 import langid  # Language detection library
 from transformers import Wav2Vec2ForCTC, AutoProcessor
 ASR_SAMPLING_RATE = 16_000
+MODEL_ID = "facebook/mms-1b-all"
+# openai/whisper-large-v3-turbo
+#ASR_SAMPLING_RATE = 16_000
+#MODEL_ID = "openai/whisper-large-v3-turbo"
 # Load MMS Model
 processor = AutoProcessor.from_pretrained(MODEL_ID)
         ids = torch.argmax(outputs, dim=-1)[0]
         final_transcription = processor.decode(ids)
+   # return f"Detected Language: {detected_lang.upper()}\n\nTranscription:\n{final_transcription}"
+return f"{final_transcription}"