Spaces:

mib-bench
/

leaderboard

Running

jasonshaoshun commited on Jan 28

Commit

f732437

1 Parent(s): 85b6004

debug

Files changed (2) hide show

app.py CHANGED Viewed

@@ -405,9 +405,9 @@ def init_leaderboard_mib_subgraph(dataframe, track):
     # Extract unique benchmarks and models from column names
     for col in result_columns:
         print(f"col is {col}")
-        benchmark, model = col.split('(')
         benchmarks.add(benchmark)
-        models.add(model[:-1])
         print(f"benchmark is {benchmark} and model is {model}")
     # Create selection groups

     # Extract unique benchmarks and models from column names
     for col in result_columns:
         print(f"col is {col}")
+        benchmark, model = col.split('-')
         benchmarks.add(benchmark)
+        models.add(model)
         print(f"benchmark is {benchmark} and model is {model}")
     # Create selection groups

src/display/utils.py CHANGED Viewed

@@ -119,27 +119,37 @@ AutoEvalColumnMultimodal = make_dataclass("AutoEvalColumnMultimodal", auto_eval_
 ##############################################################################################################
 # Version 3
-auto_eval_column_dict_mib_subgraph = []
-# Method name column
-auto_eval_column_dict_mib_subgraph.append(["method", ColumnContent, ColumnContent("Method", "markdown", True, never_hidden=True)])
-# Add Task and Model columns for filtering
-auto_eval_column_dict_mib_subgraph.append(["Task", ColumnContent, ColumnContent("Task", "str", True)])
-auto_eval_column_dict_mib_subgraph.append(["Model", ColumnContent, ColumnContent("Model", "str", True)])
-# For each task and model combination
 for task in TasksMib_Subgraph:
     for model in task.value.models:
-        col_name = f"{task.value.benchmark}({model})"
         auto_eval_column_dict_mib_subgraph.append([
-            col_name,
-            ColumnContent,
-            ColumnContent(col_name, "number", True)
         ])
-# Average column
-auto_eval_column_dict_mib_subgraph.append(["average", ColumnContent, ColumnContent("Average", "number", True)])

 ##############################################################################################################
 # Version 3
+# First, let's create field names that are valid Python identifiers
+auto_eval_column_dict_mib_subgraph = []
+# Method name column (always present)
+auto_eval_column_dict_mib_subgraph.append(
+    ["method", ColumnContent, ColumnContent("Method", "markdown", True, never_hidden=True)]
+)
+# Add columns for each task-model combination
 for task in TasksMib_Subgraph:
     for model in task.value.models:
+        # Create a valid field name by using underscores
+        field_name = f"{task.value.benchmark}-{model}"
+        # The display name can be more descriptive
+        display_name = f"{task.value.benchmark}({model})"
         auto_eval_column_dict_mib_subgraph.append([
+            field_name,  # This must be a valid Python identifier
+            ColumnContent,
+            ColumnContent(display_name, "number", True)
         ])
+# Add the Average column
+auto_eval_column_dict_mib_subgraph.append(
+    ["average", ColumnContent, ColumnContent("Average", "number", True)]
+)
+print("Debug - Column field names:")
+for field in auto_eval_column_dict_mib_subgraph:
+    print(f"Field name: {field[0]}, Display name: {field[2].name}")