Spaces:

llm-jp
/

open-japanese-llm-leaderboard

Running on CPU Upgrade

sh1gechan commited on Aug 7, 2024

Commit

d2b9af9

verified ·

1 Parent(s): f018038

Update src/leaderboard/read_evals.py

Files changed (1) hide show

src/leaderboard/read_evals.py CHANGED Viewed

@@ -73,10 +73,8 @@ class EvalResult:
         scores = data["scores"]
         results = {}
-        for task in Tasks:
-            task_value = task.value
-            if task_value.metric in scores:
-                results[task_value.benchmark] = Decimal(scores[task_value.metric])
         return self(
@@ -109,7 +107,6 @@ class EvalResult:
     def to_dict(self):
         """Converts the Eval Result to a dict compatible with our dataframe display"""
-        average = sum([v for v in self.results.values() if v is not None]) / len(Tasks)
         data_dict = {
             "eval_name": self.eval_name,  # not a column, just a save name,
             AutoEvalColumn.precision.name: self.precision.value.name,
@@ -127,8 +124,8 @@ class EvalResult:
         }
         for task in Tasks:
-            print('self.results[task.value.benchmark]', self.results[task.value.benchmark])
-            data_dict[task.value.col_name] = self.results[task.value.benchmark]
         return data_dict

         scores = data["scores"]
         results = {}
+        for key, value in scores.items():
+            results[key] = Decimal(value)
         return self(
     def to_dict(self):
         """Converts the Eval Result to a dict compatible with our dataframe display"""
         data_dict = {
             "eval_name": self.eval_name,  # not a column, just a save name,
             AutoEvalColumn.precision.name: self.precision.value.name,
         }
         for task in Tasks:
+            task_value = task.value
+            data_dict[task_value.col_name] = self.results[task_value.metric]
         return data_dict