Spaces:

asr-africa
/

asr-demos

Sleeping

Alvin-Nahabwe commited on Mar 30

Commit

87c3eaa

verified ·

1 Parent(s): d045f90

Upload app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,5 +1,5 @@
 import gradio as gr
-from transformers import pipeline, Wav2Vec2ProcessorWithLM
 import os
 def transcribe(audio, language):
@@ -24,15 +24,10 @@ def transcribe(audio, language):
         "bambara": "asr-africa/mms-bambara-50-hours-mixed-bambara-dataset",
     }
-    if language in ["hausa", "igbo", "yoruba"]:
-        revision = "lm"
-    else:
-        revision = "main"
     # load processor
-    p = Wav2Vec2ProcessorWithLM.from_pretrained(model_map[language], revision=revision)
     # load eval pipeline
-    asr = pipeline("automatic-speech-recognition", model=model_map[language], tokenizer=p.tokenizer, feature_extractor=p.feature_extractor, decoder=p.decoder, token=os.getenv('HF_TOKEN'), device=0)
     text = asr(audio)["text"]
     return text

 import gradio as gr
+from transformers import pipeline, AutoProcessor
 import os
 def transcribe(audio, language):
         "bambara": "asr-africa/mms-bambara-50-hours-mixed-bambara-dataset",
     }
     # load processor
+    p = AutoProcessor.from_pretrained(model_map[language])
     # load eval pipeline
+    asr = pipeline("automatic-speech-recognition", model=model_map[language], tokenizer=p.tokenizer, feature_extractor=p.feature_extractor, decoder=p.decoder, device=0, token=os.getenv('HF_TOKEN'))
     text = asr(audio)["text"]
     return text