Evaluation-2

Sleeping

App Files Files Community

FarmerlineML commited on 16 days ago

Commit

8b6d7cc

verified ·

1 Parent(s): d224fc3

Update app.py

Browse files

Files changed (1) hide show

app.py +23 -4

app.py CHANGED Viewed

@@ -1,14 +1,26 @@
-# app.py (simplified: no WER/CER, minimal feedback)
 import os
 import json
 import time
 import uuid
 import gradio as gr
-from transformers import pipeline
 import numpy as np
 import librosa  # pip install librosa
 # --- External logging: push to a HF Dataset repo on each submit (no local storage) ---
 from datasets import Dataset, Features, Value, Audio, load_dataset
@@ -88,12 +100,15 @@ def _push_row_to_hf_dataset(row, audio_file_path):
     )
     return "Pushed to HF Dataset."
-# --- EDIT THIS: map display names to your HF Hub model IDs ---
 language_models = {
     "Akan (Asante Twi)":        "FarmerlineML/w2v-bert-2.0_twi_alpha_v1",
     "Ewe":                      "FarmerlineML/w2v-bert-2.0_ewe_2",
     "Kiswahili":                "FarmerlineML/w2v-bert-2.0_swahili_alpha",
     "Luganda":                  "FarmerlineML/w2v-bert-2.0_luganda",
     "Brazilian Portuguese":     "FarmerlineML/w2v-bert-2.0_brazilian_portugese_alpha",
     "Fante":                    "misterkissi/w2v2-lg-xls-r-300m-fante",
     "Bemba":                    "DarliAI/kissi-w2v2-lg-xls-r-300m-bemba",
@@ -115,7 +130,6 @@ language_models = {
     # "HAITIAN CREOLE":         "misterkissi/whisper-small-haitian-creole",
     # "KABYLE":                 "misterkissi/w2v2-lg-xls-r-1b-kabyle",
     "Yoruba":                   "FarmerlineML/w2v-bert-2.0_yoruba_v1",
-    "Luganda":                  "FarmerlineML/luganda_fkd",
     "Luo":                      "FarmerlineML/w2v-bert-2.0_luo_v2",
     "Somali":                   "FarmerlineML/w2v-bert-2.0_somali_alpha",
     "Pidgin":                   "FarmerlineML/pidgin_nigerian",
@@ -143,10 +157,15 @@ def _evict_if_needed():
             pass
 def get_asr_pipeline(language_display: str):
     if language_display in _PIPELINE_CACHE:
         _touch_cache(language_display)
         return _PIPELINE_CACHE[language_display]
     model_id = language_models[language_display]
     pipe = pipeline(
         task="automatic-speech-recognition",
         model=model_id,

+# app.py (simplified + fixed language alignment; Luganda fkd commented out)
 import os
 import json
 import time
 import uuid
+import logging
 import gradio as gr
+from transformers import pipeline
 import numpy as np
 import librosa  # pip install librosa
+# Optional: modest thread hints for CPU Spaces
+try:
+    import torch
+    torch.set_num_threads(2)
+    torch.set_num_interop_threads(1)
+except Exception:
+    pass
+# Basic logging so we can verify which model is loaded per inference
+logging.basicConfig(level=logging.INFO)
 # --- External logging: push to a HF Dataset repo on each submit (no local storage) ---
 from datasets import Dataset, Features, Value, Audio, load_dataset
     )
     return "Pushed to HF Dataset."
+# --- Map display names to your HF Hub model IDs ---
+# NOTE: Previously there were duplicate keys for "Luganda". We keep only the w2v-bert model
+# and comment out the fkd variant to avoid accidental overrides.
 language_models = {
     "Akan (Asante Twi)":        "FarmerlineML/w2v-bert-2.0_twi_alpha_v1",
     "Ewe":                      "FarmerlineML/w2v-bert-2.0_ewe_2",
     "Kiswahili":                "FarmerlineML/w2v-bert-2.0_swahili_alpha",
     "Luganda":                  "FarmerlineML/w2v-bert-2.0_luganda",
+    # "Luganda (fkd)":          "FarmerlineML/luganda_fkd",  # commented out per request
     "Brazilian Portuguese":     "FarmerlineML/w2v-bert-2.0_brazilian_portugese_alpha",
     "Fante":                    "misterkissi/w2v2-lg-xls-r-300m-fante",
     "Bemba":                    "DarliAI/kissi-w2v2-lg-xls-r-300m-bemba",
     # "HAITIAN CREOLE":         "misterkissi/whisper-small-haitian-creole",
     # "KABYLE":                 "misterkissi/w2v2-lg-xls-r-1b-kabyle",
     "Yoruba":                   "FarmerlineML/w2v-bert-2.0_yoruba_v1",
     "Luo":                      "FarmerlineML/w2v-bert-2.0_luo_v2",
     "Somali":                   "FarmerlineML/w2v-bert-2.0_somali_alpha",
     "Pidgin":                   "FarmerlineML/pidgin_nigerian",
             pass
 def get_asr_pipeline(language_display: str):
+    if language_display not in language_models:
+        raise ValueError(f"Unknown language selection: {language_display}")
     if language_display in _PIPELINE_CACHE:
         _touch_cache(language_display)
         return _PIPELINE_CACHE[language_display]
     model_id = language_models[language_display]
+    logging.info(f"[ASR] Loading pipeline for '{language_display}' -> {model_id}")
     pipe = pipeline(
         task="automatic-speech-recognition",
         model=model_id,