Spaces:

mib-bench
/

leaderboard

Running

App Files Files Community

jasonshaoshun commited on Jan 29

Commit

59781bb

1 Parent(s): 9810745

debug

Browse files

Files changed (1) hide show

app.py +55 -53

app.py CHANGED Viewed

@@ -366,63 +366,65 @@ def init_leaderboard_mib_subgraph(dataframe, track):
     # Important: We need to rename our DataFrame columns to match display names
     renamed_df = dataframe.rename(columns=display_mapping)
-    # return Leaderboard(
-    #     value=renamed_df,  # Use DataFrame with display names
-    #     datatype=[c.type for c in fields(AutoEvalColumn_mib_subgraph)],
-    #     select_columns=SelectColumns(
-    #         default_selection=all_columns,  # Now contains display names
-    #         label="Select Results:"
-    #     ),
-    #     search_columns=["Method"],
-    #     hide_columns=[],
-    #     interactive=False,
-    # )
-        # Complete column groups for both benchmarks and models
-    # Define keywords for filtering
-    benchmark_keywords = ["ioi", "mcqa", "arithmetic_addition", "arithmetic_subtraction", "arc_easy", "arc_challenge"]
-    model_keywords = ["qwen2_5", "gpt2", "gemma2", "llama3"]
-    # # Optional: Define display names
-    # mappings = {
-    #     "ioi_llama3": "IOI (LLaMA-3)",
-    #     "ioi_qwen2_5": "IOI (Qwen-2.5)",
-    #     "ioi_gpt2": "IOI (GPT-2)",
-    #     "ioi_gemma2": "IOI (Gemma-2)",
-    #     "mcqa_llama3": "MCQA (LLaMA-3)",
-    #     "mcqa_qwen2_5": "MCQA (Qwen-2.5)",
-    #     "mcqa_gemma2": "MCQA (Gemma-2)",
-    #     "arithmetic_addition_llama3": "Arithmetic Addition (LLaMA-3)",
-    #     "arithmetic_subtraction_llama3": "Arithmetic Subtraction (LLaMA-3)",
-    #     "arc_easy_llama3": "ARC Easy (LLaMA-3)",
-    #     "arc_easy_gemma2": "ARC Easy (Gemma-2)",
-    #     "arc_challenge_llama3": "ARC Challenge (LLaMA-3)",
-    #     "eval_name": "Evaluation Name",
-    #     "Method": "Method",
-    #     "Average": "Average Score"
-    # }
-    mappings = {}
-    # Create SmartSelectColumns instance
-    smart_columns = SmartSelectColumns(
-        benchmark_keywords=benchmark_keywords,
-        model_keywords=model_keywords,
-        column_mapping=mappings,
-        initial_selected=["Method", "Average"]
-    )
-    print("\nDebugging DataFrame columns:", renamed_df.columns.tolist())
-    # Create Leaderboard
-    leaderboard = Leaderboard(
-        value=renamed_df,
         datatype=[c.type for c in fields(AutoEvalColumn_mib_subgraph)],
-        select_columns=smart_columns,
         search_columns=["Method"],
         hide_columns=[],
-        interactive=False
     )
-    print(f"Successfully created leaderboard.")
-    return leaderboard

     # Important: We need to rename our DataFrame columns to match display names
     renamed_df = dataframe.rename(columns=display_mapping)
+    return Leaderboard(
+        value=renamed_df,  # Use DataFrame with display names
         datatype=[c.type for c in fields(AutoEvalColumn_mib_subgraph)],
+        select_columns=SelectColumns(
+            default_selection=all_columns,  # Now contains display names
+            label="Select Results:"
+        ),
         search_columns=["Method"],
         hide_columns=[],
+        interactive=False,
     )
+    # # Complete column groups for both benchmarks and models
+    # # Define keywords for filtering
+    # benchmark_keywords = ["ioi", "mcqa", "arithmetic_addition", "arithmetic_subtraction", "arc_easy", "arc_challenge"]
+    # model_keywords = ["qwen2_5", "gpt2", "gemma2", "llama3"]
+    # # # Optional: Define display names
+    # # mappings = {
+    # #     "ioi_llama3": "IOI (LLaMA-3)",
+    # #     "ioi_qwen2_5": "IOI (Qwen-2.5)",
+    # #     "ioi_gpt2": "IOI (GPT-2)",
+    # #     "ioi_gemma2": "IOI (Gemma-2)",
+    # #     "mcqa_llama3": "MCQA (LLaMA-3)",
+    # #     "mcqa_qwen2_5": "MCQA (Qwen-2.5)",
+    # #     "mcqa_gemma2": "MCQA (Gemma-2)",
+    # #     "arithmetic_addition_llama3": "Arithmetic Addition (LLaMA-3)",
+    # #     "arithmetic_subtraction_llama3": "Arithmetic Subtraction (LLaMA-3)",
+    # #     "arc_easy_llama3": "ARC Easy (LLaMA-3)",
+    # #     "arc_easy_gemma2": "ARC Easy (Gemma-2)",
+    # #     "arc_challenge_llama3": "ARC Challenge (LLaMA-3)",
+    # #     "eval_name": "Evaluation Name",
+    # #     "Method": "Method",
+    # #     "Average": "Average Score"
+    # # }
+    # mappings = {}
+    # # Create SmartSelectColumns instance
+    # smart_columns = SmartSelectColumns(
+    #     benchmark_keywords=benchmark_keywords,
+    #     model_keywords=model_keywords,
+    #     column_mapping=mappings,
+    #     initial_selected=["Method", "Average"]
+    # )
+    # print("\nDebugging DataFrame columns:", renamed_df.columns.tolist())
+    # # Create Leaderboard
+    # leaderboard = Leaderboard(
+    #     value=renamed_df,
+    #     datatype=[c.type for c in fields(AutoEvalColumn_mib_subgraph)],
+    #     select_columns=smart_columns,
+    #     search_columns=["Method"],
+    #     hide_columns=[],
+    #     interactive=False
+    # )
+    # print(f"Successfully created leaderboard.")
+    # return leaderboard