Spaces:

mib-bench
/

leaderboard

Running

App Files Files Community

jasonshaoshun commited on Jan 22

Commit

f65df62

1 Parent(s): 55ba7bd

debug

Browse files

Files changed (1) hide show

src/display/utils.py +27 -7

src/display/utils.py CHANGED Viewed

@@ -119,23 +119,43 @@ BENCHMARK_COLS_MIB_CAUSALGRAPH = []
 #                 ColumnContent(col_name, "number", True)
 #             ])
 auto_eval_column_dict_mib_causalgraph = []
 # Method name column
 auto_eval_column_dict_mib_causalgraph.append(["method", ColumnContent, ColumnContent("Method", "markdown", True, never_hidden=True)])
-# For each model-task-intervention combination
 for task in TasksMib_Causalgraph:
-    for model in task.value.models:
-        model_name = model.lower()  # Convert model name to lowercase
         for layer in task.value.layers:
             for intervention in task.value.interventions:
                 for counterfactual in task.value.counterfactuals:
-                    # Include model name in the column name
-                    col_name = f"{model_name}_layer{layer}_{intervention}_{counterfactual}"
-                    field_name = col_name.lower()
                     auto_eval_column_dict_mib_causalgraph.append([
-                        field_name,
                         ColumnContent,
                         ColumnContent(col_name, "number", True)
                     ])

 #                 ColumnContent(col_name, "number", True)
 #             ])
+# auto_eval_column_dict_mib_causalgraph = []
+# # Method name column
+# auto_eval_column_dict_mib_causalgraph.append(["method", ColumnContent, ColumnContent("Method", "markdown", True, never_hidden=True)])
+# # For each model-task-intervention combination
+# for task in TasksMib_Causalgraph:
+#     for model in task.value.models:
+#         model_name = model.lower()  # Convert model name to lowercase
+#         for layer in task.value.layers:
+#             for intervention in task.value.interventions:
+#                 for counterfactual in task.value.counterfactuals:
+#                     # Include model name in the column name
+#                     col_name = f"{model_name}_layer{layer}_{intervention}_{counterfactual}"
+#                     field_name = col_name.lower()
+#                     auto_eval_column_dict_mib_causalgraph.append([
+#                         field_name,
+#                         ColumnContent,
+#                         ColumnContent(col_name, "number", True)
+#                     ])
+# In utils.py, modify auto_eval_column_dict_mib_causalgraph:
 auto_eval_column_dict_mib_causalgraph = []
 # Method name column
 auto_eval_column_dict_mib_causalgraph.append(["method", ColumnContent, ColumnContent("Method", "markdown", True, never_hidden=True)])
+# For each model-task-intervention-counterfactual combination
 for task in TasksMib_Causalgraph:
+    for model in ["qwen2forcausallm", "gemma2forcausallm", "llamaforcausallm"]:  # exact model names
         for layer in task.value.layers:
             for intervention in task.value.interventions:
                 for counterfactual in task.value.counterfactuals:
+                    # Match the exact format from the data
+                    col_name = f"{model}_layer{layer}_{intervention}_{counterfactual}".lower()
                     auto_eval_column_dict_mib_causalgraph.append([
+                        col_name,
                         ColumnContent,
                         ColumnContent(col_name, "number", True)
                     ])