Spaces:

argmaxinc
/

whisperkit-benchmarks

Running

ardaatahan commited on Oct 30, 2024

Commit

8f6a603

1 Parent(s): 3e6fa1f

stop showing english-only model to models that have multilingual wer

Files changed (1) hide show

main.py CHANGED Viewed

@@ -31,7 +31,6 @@ from constants import (
 from utils import (
     add_datasets_to_performance_columns,
     add_datasets_to_quality_columns,
-    calculate_parity,
     create_confusion_matrix_plot,
     create_initial_performance_column_dict,
     create_initial_quality_column_dict,
@@ -110,6 +109,16 @@ model_to_multilingual_wer = dict(
     zip(multilingual_df["Model"], multilingual_df["Average WER"])
 )
 # Add English WER and Multilingual WER to performance_df
 benchmark_df["english_wer"] = benchmark_df["model"].map(model_to_english_wer)
 benchmark_df["multilingual_wer"] = benchmark_df["model"].map(model_to_multilingual_wer)

 from utils import (
     add_datasets_to_performance_columns,
     add_datasets_to_quality_columns,
     create_confusion_matrix_plot,
     create_initial_performance_column_dict,
     create_initial_quality_column_dict,
     zip(multilingual_df["Model"], multilingual_df["Average WER"])
 )
+# Copy over the multilingual WER to matching models
+multilingual_models = {}
+for multilingual_model, multilingual_wer in model_to_multilingual_wer.items():
+    for model in benchmark_df["model"].unique().tolist():
+        if multilingual_model in model and not model.endswith("en"):
+            multilingual_models[model] = multilingual_wer
+# Update the dictionary with turbo models
+model_to_multilingual_wer.update(multilingual_models)
 # Add English WER and Multilingual WER to performance_df
 benchmark_df["english_wer"] = benchmark_df["model"].map(model_to_english_wer)
 benchmark_df["multilingual_wer"] = benchmark_df["model"].map(model_to_multilingual_wer)