open_pl_llm_leaderboard

Runtime error

djstrong commited on Feb 24, 2024

Commit

3bb301b

1 Parent(s): 1f30b67

add n-shot param

Files changed (3) hide show

src/display/utils.py CHANGED Viewed

@@ -40,6 +40,7 @@ auto_eval_column_dict.append(["params", ColumnContent, ColumnContent("#Params (B
 auto_eval_column_dict.append(["likes", ColumnContent, ColumnContent("Hub ❤️", "number", False)])
 auto_eval_column_dict.append(["still_on_hub", ColumnContent, ColumnContent("Available on the hub", "bool", False)])
 auto_eval_column_dict.append(["revision", ColumnContent, ColumnContent("Model sha", "str", False, False)])
 # Dummy column for the search bar (hidden by the custom CSS)
 auto_eval_column_dict.append(["dummy", ColumnContent, ColumnContent("model_name_for_query", "str", False, dummy=True)])

 auto_eval_column_dict.append(["likes", ColumnContent, ColumnContent("Hub ❤️", "number", False)])
 auto_eval_column_dict.append(["still_on_hub", ColumnContent, ColumnContent("Available on the hub", "bool", False)])
 auto_eval_column_dict.append(["revision", ColumnContent, ColumnContent("Model sha", "str", False, False)])
+auto_eval_column_dict.append(["n_shot", ColumnContent, ColumnContent("n_shot", "number", False)])
 # Dummy column for the search bar (hidden by the custom CSS)
 auto_eval_column_dict.append(["dummy", ColumnContent, ColumnContent("model_name_for_query", "str", False, dummy=True)])

src/leaderboard/read_evals.py CHANGED Viewed

@@ -31,6 +31,7 @@ class EvalResult:
     num_params: int = 0
     date: str = "" # submission date of request file
     still_on_hub: bool = False
     @classmethod
     def init_from_json_file(self, json_filepath, n_shot_num):
@@ -90,7 +91,8 @@ class EvalResult:
             precision=precision,
             revision= config.get("model_sha", ""),
             still_on_hub=still_on_hub,
-            architecture=architecture
         )
     def update_with_request_file(self, requests_path):
@@ -200,7 +202,10 @@ class EvalResult:
         except KeyError:
             print(f"Could not find still on hub")
         for task in Tasks:
             try:

     num_params: int = 0
     date: str = "" # submission date of request file
     still_on_hub: bool = False
+    n_shot: int = 0
     @classmethod
     def init_from_json_file(self, json_filepath, n_shot_num):
             precision=precision,
             revision= config.get("model_sha", ""),
             still_on_hub=still_on_hub,
+            architecture=architecture,
+            n_shot=n_shot_num
         )
     def update_with_request_file(self, requests_path):
         except KeyError:
             print(f"Could not find still on hub")
+        try:
+            data_dict[AutoEvalColumn.n_shot.name] = self.n_shot
+        except KeyError:
+            print(f"Could not find still on hub")
         for task in Tasks:
             try:

src/populate.py CHANGED Viewed

@@ -17,9 +17,7 @@ def get_leaderboard_df(results_path: str, requests_path: str, cols: list, benchm
     df = df[cols].round(decimals=2)
     # filter out if any of the benchmarks have not been produced
-    print('X1', df)
     df2 = df[has_no_nan_values(df, benchmark_cols)]
-    print('X2', df2)
     return raw_data, df

     df = df[cols].round(decimals=2)
     # filter out if any of the benchmarks have not been produced
     df2 = df[has_no_nan_values(df, benchmark_cols)]
     return raw_data, df