Spaces:

CZLC
/

BenCzechMark

Running

App Files Files Community

idolezal commited on Aug 29, 2024

Commit

96c0414

1 Parent(s): 32a069d

CSV have to use different dataframe without Markdown and HTML

Browse files

Files changed (1) hide show

server.py +37 -21

server.py CHANGED Viewed

@@ -218,7 +218,7 @@ class LeaderboardServer:
             self.tournament_dataframes = tournament_dataframes
         leaderboard_dataframes_csv = {
-            category: self._dataframe_to_csv(self.get_leaderboard(category=category), f"Leaderboard - {category}.csv")
             for category in categories
         }
@@ -226,7 +226,7 @@ class LeaderboardServer:
             tournament_dataframes_csv = {
                 submission_id: {
                     category: self._dataframe_to_csv(
-                        self.get_model_tournament_table(submission_id, category).data,
                         f"Tournament table - {self.submission_id_to_data[submission_id]['metadata']['model_name'][:self.MAX_LENGTH_OF_MODEL_TITLE]} - {category}.csv",
                     )
                     for category in sorted(self.TASKS_CATEGORIES)
@@ -378,7 +378,7 @@ class LeaderboardServer:
         with self.var_lock.ro:
             return copy.copy(self.tournament_dataframes[submission_id][category])
-    def _get_model_tournament_table(self, submission_id, category):
         if category == self.TASKS_CATEGORY_OVERALL:
             return None
@@ -392,19 +392,26 @@ class LeaderboardServer:
                 for task in self.tournament_results[submission_id][competitor_id]:
                     task_category = self.TASKS_METADATA[task]["category"]
                     if task_category == category:
-                        match_task_result_details = dict.fromkeys(["significant", "p_value"])  # order has impact to sorting DataFrame
-                        match_task_result_details.update(copy.deepcopy(self.tournament_results[submission_id][competitor_id][task]))
-                        match_task_result_details["significant"] = str(match_task_result_details["significant"]).lower()  # originaly bool
-                        match_task_result_significant = match_task_result_details["significant"]
-                        match_task_result_details = "\n".join(f"{k}: {v}" for k, v in match_task_result_details.items())
-                        match_results[task] = f'<abbr title={xmlQuoteAttr(match_task_result_details)}>{match_task_result_significant}</abbr>'
                 model_link = data["metadata"]["link_to_model"]
                 model_title = data["metadata"]["team_name"] + "/" + data["metadata"]["model_name"]
-                model_title_abbr_team_name = self.abbreviate(data["metadata"]["team_name"], self.MAX_LENGTH_OF_MODEL_TITLE)
-                model_title_abbr_model_name = self.abbreviate(data["metadata"]["model_name"], self.MAX_LENGTH_OF_MODEL_TITLE)
-                model_title_abbr_html = f'<div style="font-size: 10px;">{xmlAndMarkdownEscape(model_title_abbr_team_name)}</div>{xmlAndMarkdownEscape(model_title_abbr_model_name)}'
-                match_results["model"] = f'<a href={xmlQuoteAttr(model_link)} title={xmlQuoteAttr(model_title)}>{model_title_abbr_html}</a>'
                 model_tournament_table.append(match_results)
@@ -412,9 +419,11 @@ class LeaderboardServer:
             extra_attributes_map_word_to_header = {
                 "model": "Competitor",
             }
             first_attributes = [
                 "model",
             ]
             df_order = [
                 key
@@ -433,7 +442,8 @@ class LeaderboardServer:
             dataframe = dataframe.rename(
                 columns=attributes_map_word_to_header
             )
-            dataframe = dataframe.style.apply(self._model_tournament_table_highlight_true_and_false, axis=None)
             return dataframe
     def _dataframe_to_csv(self, dataframe, filename):
@@ -444,7 +454,7 @@ class LeaderboardServer:
             pass
         filepath = os.path.join(self.DIR_DATAFRAMES_CSV, filename)
-        dataframe.to_csv(filepath)
         return filepath
     def get_leaderboard_csv(self, category=None):
@@ -460,7 +470,7 @@ class LeaderboardServer:
         else:
             return self._get_leaderboard(pre_submit=pre_submit, category=category)
-    def _get_leaderboard(self, pre_submit=None, category=None):
         with self.var_lock.ro:
             tournament_results = pre_submit.tournament_results if pre_submit else self.tournament_results
             category = category if category else self.TASKS_CATEGORY_OVERALL
@@ -522,10 +532,15 @@ class LeaderboardServer:
                     model_link = data["metadata"]["link_to_model"]
                     model_title = data["metadata"]["team_name"] + "/" + data["metadata"]["model_name"]
-                    model_title_abbr_team_name = self.abbreviate(data["metadata"]["team_name"], self.MAX_LENGTH_OF_MODEL_TITLE)
-                    model_title_abbr_model_name = self.abbreviate(data["metadata"]["model_name"], self.MAX_LENGTH_OF_MODEL_TITLE)
-                    model_title_abbr_html = f'<div style="font-size: 10px;">{xmlAndMarkdownEscape(model_title_abbr_team_name)}</div>{xmlAndMarkdownEscape(model_title_abbr_model_name)}'
-                    local_results["model"] = f'<a href={xmlQuoteAttr(model_link)} title={xmlQuoteAttr(model_title)}>{model_title_abbr_html}</a>'
                     release = data["metadata"].get("submission_timestamp")
                     release = time.strftime("%Y-%m-%d", time.gmtime(release)) if release else "N/A"
                     local_results["release"] = release
@@ -549,10 +564,11 @@ class LeaderboardServer:
                     "input_length": "Input length (# tokens)",
                     "precision": "Precision",
                     "description": "Description",
-                    "link_to_model": "Link to model"
                 }
                 first_attributes = [
                     "model",
                     "release",
                     "model_type",
                     "parameters",

             self.tournament_dataframes = tournament_dataframes
         leaderboard_dataframes_csv = {
+            category: self._dataframe_to_csv(self._get_leaderboard(category=category, to_csv=True), f"Leaderboard - {category}.csv")
             for category in categories
         }
             tournament_dataframes_csv = {
                 submission_id: {
                     category: self._dataframe_to_csv(
+                        self._get_model_tournament_table(submission_id, category, to_csv=True),
                         f"Tournament table - {self.submission_id_to_data[submission_id]['metadata']['model_name'][:self.MAX_LENGTH_OF_MODEL_TITLE]} - {category}.csv",
                     )
                     for category in sorted(self.TASKS_CATEGORIES)
         with self.var_lock.ro:
             return copy.copy(self.tournament_dataframes[submission_id][category])
+    def _get_model_tournament_table(self, submission_id, category, to_csv=False):
         if category == self.TASKS_CATEGORY_OVERALL:
             return None
                 for task in self.tournament_results[submission_id][competitor_id]:
                     task_category = self.TASKS_METADATA[task]["category"]
                     if task_category == category:
+                        if to_csv:
+                            match_results[task] = self.tournament_results[submission_id][competitor_id][task]
+                        else:
+                            match_task_result_details = dict.fromkeys(["significant", "p_value"])  # order has impact to sorting DataFrame
+                            match_task_result_details.update(copy.deepcopy(self.tournament_results[submission_id][competitor_id][task]))
+                            match_task_result_details["significant"] = str(match_task_result_details["significant"]).lower()  # originaly bool
+                            match_task_result_significant = match_task_result_details["significant"]
+                            match_task_result_details = "\n".join(f"{k}: {v}" for k, v in match_task_result_details.items())
+                            match_results[task] = f'<abbr title={xmlQuoteAttr(match_task_result_details)}>{match_task_result_significant}</abbr>'
                 model_link = data["metadata"]["link_to_model"]
                 model_title = data["metadata"]["team_name"] + "/" + data["metadata"]["model_name"]
+                if to_csv:
+                    match_results["model"] = model_title
+                    match_results["link_to_model"] = model_link
+                else:
+                    model_title_abbr_team_name = self.abbreviate(data["metadata"]["team_name"], self.MAX_LENGTH_OF_MODEL_TITLE)
+                    model_title_abbr_model_name = self.abbreviate(data["metadata"]["model_name"], self.MAX_LENGTH_OF_MODEL_TITLE)
+                    model_title_abbr_html = f'<div style="font-size: 10px;">{xmlAndMarkdownEscape(model_title_abbr_team_name)}</div>{xmlAndMarkdownEscape(model_title_abbr_model_name)}'
+                    match_results["model"] = f'<a href={xmlQuoteAttr(model_link)} title={xmlQuoteAttr(model_title)}>{model_title_abbr_html}</a>'
                 model_tournament_table.append(match_results)
             extra_attributes_map_word_to_header = {
                 "model": "Competitor",
+                "link_to_model": "Link to model",
             }
             first_attributes = [
                 "model",
+                "link_to_model",
             ]
             df_order = [
                 key
             dataframe = dataframe.rename(
                 columns=attributes_map_word_to_header
             )
+            if not to_csv:
+                dataframe = dataframe.style.apply(self._model_tournament_table_highlight_true_and_false, axis=None)
             return dataframe
     def _dataframe_to_csv(self, dataframe, filename):
             pass
         filepath = os.path.join(self.DIR_DATAFRAMES_CSV, filename)
+        dataframe.to_csv(filepath, index=False)
         return filepath
     def get_leaderboard_csv(self, category=None):
         else:
             return self._get_leaderboard(pre_submit=pre_submit, category=category)
+    def _get_leaderboard(self, pre_submit=None, category=None, to_csv=False):
         with self.var_lock.ro:
             tournament_results = pre_submit.tournament_results if pre_submit else self.tournament_results
             category = category if category else self.TASKS_CATEGORY_OVERALL
                     model_link = data["metadata"]["link_to_model"]
                     model_title = data["metadata"]["team_name"] + "/" + data["metadata"]["model_name"]
+                    if to_csv:
+                        local_results["model"] = model_title
+                        local_results["link_to_model"] = model_link
+                    else:
+                        model_title_abbr_team_name = self.abbreviate(data["metadata"]["team_name"], self.MAX_LENGTH_OF_MODEL_TITLE)
+                        model_title_abbr_model_name = self.abbreviate(data["metadata"]["model_name"], self.MAX_LENGTH_OF_MODEL_TITLE)
+                        model_title_abbr_html = f'<div style="font-size: 10px;">{xmlAndMarkdownEscape(model_title_abbr_team_name)}</div>{xmlAndMarkdownEscape(model_title_abbr_model_name)}'
+                        local_results["model"] = f'<a href={xmlQuoteAttr(model_link)} title={xmlQuoteAttr(model_title)}>{model_title_abbr_html}</a>'
                     release = data["metadata"].get("submission_timestamp")
                     release = time.strftime("%Y-%m-%d", time.gmtime(release)) if release else "N/A"
                     local_results["release"] = release
                     "input_length": "Input length (# tokens)",
                     "precision": "Precision",
                     "description": "Description",
+                    "link_to_model": "Link to model",
                 }
                 first_attributes = [
                     "model",
+                    "link_to_model",
                     "release",
                     "model_type",
                     "parameters",