Spaces:

mib-bench
/

leaderboard

Running

App Files Files Community

jasonshaoshun commited on Jan 29

Commit

2797503

1 Parent(s): 59781bb

debug

Browse files

Files changed (1) hide show

app.py +53 -54

app.py CHANGED Viewed

@@ -366,65 +366,64 @@ def init_leaderboard_mib_subgraph(dataframe, track):
     # Important: We need to rename our DataFrame columns to match display names
     renamed_df = dataframe.rename(columns=display_mapping)
-    return Leaderboard(
-        value=renamed_df,  # Use DataFrame with display names
-        datatype=[c.type for c in fields(AutoEvalColumn_mib_subgraph)],
-        select_columns=SelectColumns(
-            default_selection=all_columns,  # Now contains display names
-            label="Select Results:"
-        ),
-        search_columns=["Method"],
-        hide_columns=[],
-        interactive=False,
-    )
-    # # Complete column groups for both benchmarks and models
-    # # Define keywords for filtering
-    # benchmark_keywords = ["ioi", "mcqa", "arithmetic_addition", "arithmetic_subtraction", "arc_easy", "arc_challenge"]
-    # model_keywords = ["qwen2_5", "gpt2", "gemma2", "llama3"]
-    # # # Optional: Define display names
-    # # mappings = {
-    # #     "ioi_llama3": "IOI (LLaMA-3)",
-    # #     "ioi_qwen2_5": "IOI (Qwen-2.5)",
-    # #     "ioi_gpt2": "IOI (GPT-2)",
-    # #     "ioi_gemma2": "IOI (Gemma-2)",
-    # #     "mcqa_llama3": "MCQA (LLaMA-3)",
-    # #     "mcqa_qwen2_5": "MCQA (Qwen-2.5)",
-    # #     "mcqa_gemma2": "MCQA (Gemma-2)",
-    # #     "arithmetic_addition_llama3": "Arithmetic Addition (LLaMA-3)",
-    # #     "arithmetic_subtraction_llama3": "Arithmetic Subtraction (LLaMA-3)",
-    # #     "arc_easy_llama3": "ARC Easy (LLaMA-3)",
-    # #     "arc_easy_gemma2": "ARC Easy (Gemma-2)",
-    # #     "arc_challenge_llama3": "ARC Challenge (LLaMA-3)",
-    # #     "eval_name": "Evaluation Name",
-    # #     "Method": "Method",
-    # #     "Average": "Average Score"
-    # # }
     # mappings = {}
-    # # Create SmartSelectColumns instance
-    # smart_columns = SmartSelectColumns(
-    #     benchmark_keywords=benchmark_keywords,
-    #     model_keywords=model_keywords,
-    #     column_mapping=mappings,
-    #     initial_selected=["Method", "Average"]
-    # )
-    # print("\nDebugging DataFrame columns:", renamed_df.columns.tolist())
-    # # Create Leaderboard
-    # leaderboard = Leaderboard(
-    #     value=renamed_df,
-    #     datatype=[c.type for c in fields(AutoEvalColumn_mib_subgraph)],
-    #     select_columns=smart_columns,
-    #     search_columns=["Method"],
-    #     hide_columns=[],
-    #     interactive=False
-    # )
-    # print(f"Successfully created leaderboard.")
-    # return leaderboard

     # Important: We need to rename our DataFrame columns to match display names
     renamed_df = dataframe.rename(columns=display_mapping)
+    # return Leaderboard(
+    #     value=renamed_df,  # Use DataFrame with display names
+    #     datatype=[c.type for c in fields(AutoEvalColumn_mib_subgraph)],
+    #     select_columns=SelectColumns(
+    #         default_selection=all_columns,  # Now contains display names
+    #         label="Select Results:"
+    #     ),
+    #     search_columns=["Method"],
+    #     hide_columns=[],
+    #     interactive=False,
+    # )
+    # Complete column groups for both benchmarks and models
+    # Define keywords for filtering
+    benchmark_keywords = ["ioi", "mcqa", "arithmetic_addition", "arithmetic_subtraction", "arc_easy", "arc_challenge"]
+    model_keywords = ["qwen2_5", "gpt2", "gemma2", "llama3"]
+    # Optional: Define display names
+    mappings = {
+        "ioi_llama3": "IOI (LLaMA-3)",
+        "ioi_qwen2_5": "IOI (Qwen-2.5)",
+        "ioi_gpt2": "IOI (GPT-2)",
+        "ioi_gemma2": "IOI (Gemma-2)",
+        "mcqa_llama3": "MCQA (LLaMA-3)",
+        "mcqa_qwen2_5": "MCQA (Qwen-2.5)",
+        "mcqa_gemma2": "MCQA (Gemma-2)",
+        "arithmetic_addition_llama3": "Arithmetic Addition (LLaMA-3)",
+        "arithmetic_subtraction_llama3": "Arithmetic Subtraction (LLaMA-3)",
+        "arc_easy_llama3": "ARC Easy (LLaMA-3)",
+        "arc_easy_gemma2": "ARC Easy (Gemma-2)",
+        "arc_challenge_llama3": "ARC Challenge (LLaMA-3)",
+        "eval_name": "Evaluation Name",
+        "Method": "Method",
+        "Average": "Average Score"
+    }
     # mappings = {}
+    # Create SmartSelectColumns instance
+    smart_columns = SmartSelectColumns(
+        benchmark_keywords=benchmark_keywords,
+        model_keywords=model_keywords,
+        column_mapping=mappings,
+        initial_selected=["Method", "Average"]
+    )
+    print("\nDebugging DataFrame columns:", renamed_df.columns.tolist())
+    # Create Leaderboard
+    leaderboard = Leaderboard(
+        value=renamed_df,
+        datatype=[c.type for c in fields(AutoEvalColumn_mib_subgraph)],
+        select_columns=smart_columns,
+        search_columns=["Method"],
+        hide_columns=[],
+        interactive=False
+    )
+    print(f"Successfully created leaderboard.")
+    return leaderboard