Spaces:

akera
/

leaderboard

Running

App Files Files Community

akera commited on Jun 16

Commit

a4523eb

verified ·

1 Parent(s): ceca234

Update app.py

Browse files

Files changed (1) hide show

app.py +134 -30

app.py CHANGED Viewed

@@ -408,32 +408,53 @@ def refresh_track_leaderboard(
         if current_leaderboard is None:
             current_leaderboard = load_scientific_leaderboard()
-        # Get track-specific leaderboard
-        track_leaderboard = get_track_leaderboard(
-            current_leaderboard, track, category_filter=category_filter, min_adequacy=min_adequacy
-        )
         # Apply search filter
-        if search_query:
-            query_lower = search_query.lower()
-            mask = (
-                track_leaderboard['model_name'].str.lower().str.contains(query_lower, na=False) |
-                track_leaderboard['author'].str.lower().str.contains(query_lower, na=False)
-            )
-            track_leaderboard = track_leaderboard[mask]
         # Prepare for display
-        display_df = prepare_track_leaderboard_display(track_leaderboard, track)
-        # Create plots
-        ranking_plot = create_scientific_leaderboard_plot(track_leaderboard, track)
-        comparison_plot = create_statistical_comparison_plot(track_leaderboard, track)
-        # Get track statistics
-        track_stats = get_scientific_leaderboard_stats(track_leaderboard, track)
-        track_config = EVALUATION_TRACKS[track]
-        stats_text = f"""
 ### 📊 {track_config['name']} Statistics
 - **Total Models**: {track_stats.get('total_models', 0)}
@@ -447,12 +468,16 @@ def refresh_track_leaderboard(
 - All metrics include 95% confidence intervals
 - Statistical adequacy verified for reliable comparisons
 - {track_config['description']}
-        """
         return display_df, ranking_plot, comparison_plot, stats_text
     except Exception as e:
         error_msg = f"Error loading {track} leaderboard: {str(e)}"
         empty_df = pd.DataFrame()
         return empty_df, None, None, error_msg
@@ -659,46 +684,125 @@ with gr.Blocks(
         margin-bottom: 2rem;
         padding: 2rem;
         background: linear-gradient(135deg, #1e3a8a 0%, #3730a3 50%, #1e40af 100%);
-        color: white;
         border-radius: 10px;
         box-shadow: 0 4px 6px rgba(0, 0, 0, 0.1);
     }
     .track-tab {
         border-radius: 8px;
         margin: 0.5rem;
         padding: 1rem;
         border: 2px solid transparent;
     }
     .track-tab.google-comparable {
         border-color: #1f77b4;
-        background: linear-gradient(45deg, #f0f9ff, #e0f2fe);
     }
     .track-tab.ug40-complete {
         border-color: #ff7f0e;
-        background: linear-gradient(45deg, #fff7ed, #fed7aa);
     }
     .track-tab.language-pair-matrix {
         border-color: #2ca02c;
-        background: linear-gradient(45deg, #f0fdf4, #dcfce7);
     }
     .metric-box {
-        background: #f8fafc;
         padding: 1rem;
         border-radius: 8px;
         margin: 0.5rem 0;
         border-left: 4px solid #3b82f6;
     }
     .scientific-note {
-        background: #fef3c7;
         border: 1px solid #f59e0b;
         border-radius: 8px;
         padding: 1rem;
         margin: 1rem 0;
     }
-    .adequacy-excellent { border-left-color: #22c55e; }
-    .adequacy-good { border-left-color: #eab308; }
-    .adequacy-fair { border-left-color: #f97316; }
-    .adequacy-insufficient { border-left-color: #ef4444; }
     """
 ) as demo:

         if current_leaderboard is None:
             current_leaderboard = load_scientific_leaderboard()
+        # Get track-specific leaderboard with better error handling
+        try:
+            track_leaderboard = get_track_leaderboard(
+                current_leaderboard, track, category_filter=category_filter, min_adequacy=min_adequacy
+            )
+        except Exception as e:
+            print(f"Error getting track leaderboard for {track}: {e}")
+            track_leaderboard = pd.DataFrame()
         # Apply search filter
+        if search_query and not track_leaderboard.empty:
+            try:
+                query_lower = search_query.lower()
+                mask = (
+                    track_leaderboard['model_name'].str.lower().str.contains(query_lower, na=False) |
+                    track_leaderboard['author'].str.lower().str.contains(query_lower, na=False)
+                )
+                track_leaderboard = track_leaderboard[mask]
+            except Exception as e:
+                print(f"Error applying search filter: {e}")
         # Prepare for display
+        try:
+            display_df = prepare_track_leaderboard_display(track_leaderboard, track)
+        except Exception as e:
+            print(f"Error preparing display: {e}")
+            display_df = pd.DataFrame()
+        # Create plots with error handling
+        try:
+            ranking_plot = create_scientific_leaderboard_plot(track_leaderboard, track)
+        except Exception as e:
+            print(f"Error creating ranking plot: {e}")
+            ranking_plot = None
+        try:
+            comparison_plot = create_statistical_comparison_plot(track_leaderboard, track)
+        except Exception as e:
+            print(f"Error creating comparison plot: {e}")
+            comparison_plot = None
+        # Get track statistics
+        try:
+            track_stats = get_scientific_leaderboard_stats(track_leaderboard, track)
+            track_config = EVALUATION_TRACKS[track]
+            stats_text = f"""
 ### 📊 {track_config['name']} Statistics
 - **Total Models**: {track_stats.get('total_models', 0)}
 - All metrics include 95% confidence intervals
 - Statistical adequacy verified for reliable comparisons
 - {track_config['description']}
+            """
+        except Exception as e:
+            print(f"Error generating stats: {e}")
+            stats_text = f"Error loading {track} statistics: {str(e)}"
         return display_df, ranking_plot, comparison_plot, stats_text
     except Exception as e:
         error_msg = f"Error loading {track} leaderboard: {str(e)}"
+        print(error_msg)
         empty_df = pd.DataFrame()
         return empty_df, None, None, error_msg
         margin-bottom: 2rem;
         padding: 2rem;
         background: linear-gradient(135deg, #1e3a8a 0%, #3730a3 50%, #1e40af 100%);
+        color: white !important;
         border-radius: 10px;
         box-shadow: 0 4px 6px rgba(0, 0, 0, 0.1);
     }
+    .scientific-header h1 {
+        color: white !important;
+        margin-bottom: 1rem;
+    }
+    .scientific-header p {
+        color: #e0f2fe !important;
+        margin: 0.5rem 0;
+    }
     .track-tab {
         border-radius: 8px;
         margin: 0.5rem;
         padding: 1rem;
         border: 2px solid transparent;
+        background: var(--background-fill-primary) !important;
+        color: var(--body-text-color) !important;
     }
     .track-tab.google-comparable {
         border-color: #1f77b4;
+        background: linear-gradient(45deg, #f0f9ff, #e0f2fe) !important;
+        color: #1e40af !important;
     }
     .track-tab.ug40-complete {
         border-color: #ff7f0e;
+        background: linear-gradient(45deg, #fff7ed, #fed7aa) !important;
+        color: #9a3412 !important;
     }
     .track-tab.language-pair-matrix {
         border-color: #2ca02c;
+        background: linear-gradient(45deg, #f0fdf4, #dcfce7) !important;
+        color: #166534 !important;
     }
     .metric-box {
+        background: var(--background-fill-secondary) !important;
         padding: 1rem;
         border-radius: 8px;
         margin: 0.5rem 0;
         border-left: 4px solid #3b82f6;
+        color: var(--body-text-color) !important;
     }
     .scientific-note {
+        background: var(--background-fill-secondary) !important;
         border: 1px solid #f59e0b;
         border-radius: 8px;
         padding: 1rem;
         margin: 1rem 0;
+        color: var(--body-text-color) !important;
+    }
+    .adequacy-excellent { border-left-color: #22c55e !important; }
+    .adequacy-good { border-left-color: #eab308 !important; }
+    .adequacy-fair { border-left-color: #f97316 !important; }
+    .adequacy-insufficient { border-left-color: #ef4444 !important; }
+    /* Force text visibility in both light and dark modes */
+    .markdown {
+        color: var(--body-text-color) !important;
+    }
+    .markdown h1, .markdown h2, .markdown h3, .markdown h4, .markdown h5, .markdown h6 {
+        color: var(--body-text-color) !important;
+    }
+    .markdown p, .markdown li, .markdown td, .markdown th {
+        color: var(--body-text-color) !important;
+    }
+    .markdown strong {
+        color: var(--body-text-color) !important;
+        font-weight: bold;
+    }
+    .markdown em {
+        color: var(--body-text-color) !important;
+        font-style: italic;
+    }
+    .markdown code {
+        background: var(--background-fill-secondary) !important;
+        color: var(--body-text-color) !important;
+        padding: 0.2em 0.4em;
+        border-radius: 4px;
+    }
+    .markdown pre {
+        background: var(--background-fill-secondary) !important;
+        color: var(--body-text-color) !important;
+        padding: 1rem;
+        border-radius: 8px;
+        overflow-x: auto;
+    }
+    .markdown blockquote {
+        border-left: 4px solid var(--border-color-primary);
+        padding-left: 1rem;
+        margin-left: 0;
+        color: var(--body-text-color) !important;
+    }
+    /* Ensure all text elements are visible */
+    * {
+        color: var(--body-text-color) !important;
+    }
+    /* Override any problematic text colors */
+    .gr-markdown, .gr-markdown *,
+    .gradio-html, .gradio-html *,
+    .gr-textbox, .gr-dropdown,
+    .gr-button, label {
+        color: var(--body-text-color) !important;
+    }
+    /* Special handling for buttons */
+    .gr-button {
+        background: var(--button-primary-background-fill) !important;
+        color: var(--button-primary-text-color) !important;
+        border: 1px solid var(--border-color-primary) !important;
+    }
+    /* Tables */
+    .gr-dataframe, .gr-dataframe * {
+        color: var(--body-text-color) !important;
+        background: var(--background-fill-primary) !important;
     }
     """
 ) as demo: