Spaces:

kostis-init
/

CP-Bench-Leaderboard

Running

App Files Files Community

kostis-init commited on 16 days ago

Commit

5e53d23

1 Parent(s): a475949

remove unused constants and redundant imports; update Dockerfile dependencies

Browse files

Files changed (3) hide show

Dockerfile +1 -0
src/config.py +0 -6
src/eval.py +11 -36

Dockerfile CHANGED Viewed

@@ -3,6 +3,7 @@ FROM python:3.12-slim
 RUN apt-get update && apt-get install -y --no-install-recommends \
     wget \
     ca-certificates \
     && rm -rf /var/lib/apt/lists/*
 # Set the working directory in the container

 RUN apt-get update && apt-get install -y --no-install-recommends \
     wget \
     ca-certificates \
+    libgl1-mesa-glx \
     && rm -rf /var/lib/apt/lists/*
 # Set the working directory in the container

src/config.py CHANGED Viewed

@@ -1,8 +1,3 @@
-# File and directory paths
-import os
-EVAL_SCRIPT_PATH = "src/eval.py"
 LOCAL_TEMP_SUBMISSIONS_DIR = "temp_submissions_app"
 # Hugging Face Dataset Configuration
@@ -27,7 +22,6 @@ SUPPORTED_FRAMEWORKS = [
 def print_config():
     """Print the configuration settings."""
     print("Configuration Settings:")
-    print(f"EVAL_SCRIPT_PATH: {EVAL_SCRIPT_PATH}")
     print(f"LOCAL_TEMP_SUBMISSIONS_DIR: {LOCAL_TEMP_SUBMISSIONS_DIR}")
     print(f"DATASET_REPO_ID: {DATASET_REPO_ID}")
     print(f"DS_SUBMISSIONS_PATH: {DS_SUBMISSIONS_PATH}")

 LOCAL_TEMP_SUBMISSIONS_DIR = "temp_submissions_app"
 # Hugging Face Dataset Configuration
 def print_config():
     """Print the configuration settings."""
     print("Configuration Settings:")
     print(f"LOCAL_TEMP_SUBMISSIONS_DIR: {LOCAL_TEMP_SUBMISSIONS_DIR}")
     print(f"DATASET_REPO_ID: {DATASET_REPO_ID}")
     print(f"DS_SUBMISSIONS_PATH: {DS_SUBMISSIONS_PATH}")

src/eval.py CHANGED Viewed

@@ -1,17 +1,19 @@
-# eval.py
 import datetime
-import sys
-import os
 import time
 import json
-import subprocess
 import tempfile
-from pathlib import Path
 import minizinc
-from datasets import load_dataset  # Hugging Face datasets library
-from huggingface_hub import HfApi, hf_hub_download, snapshot_download # For user data dataset
-from huggingface_hub.utils import RepositoryNotFoundError
 # --- Configuration ---
@@ -24,37 +26,10 @@ GT_MODEL_CODE_COLUMN = "model"
 # Timeout for running individual model scripts (both generated and modified ground-truth)
 SCRIPT_EXECUTION_TIMEOUT = 60  # seconds
-"""Handles evaluation of submissions."""
-import os
-import sys
-import subprocess
-import threading
-from pathlib import Path
-from src.config import EVAL_SCRIPT_PATH, DATASET_REPO_ID, DS_RESULTS_PATH, CPMPY_FRAMEWORK, ORTOOLS_FRAMEWORK, \
-    MINIZINC_FRAMEWORK
 def run_evaluation(submission_path):
-    # if not Path(EVAL_SCRIPT_PATH).exists():
-    #     print(f"ERROR: Eval script '{EVAL_SCRIPT_PATH}' not found")
-    #     return
     print(f"Starting evaluation for: {submission_path}")
-    # command = [
-    #     sys.executable,
-    #     EVAL_SCRIPT_PATH,
-    #     DATASET_REPO_ID,
-    #     submission_path,
-    #     DS_RESULTS_PATH
-    # ]
     main_eval(DATASET_REPO_ID, submission_path, DS_RESULTS_PATH)
     print(f"Evaluation process complete for: {submission_path}", flush=True)
@@ -67,6 +42,7 @@ def start_background_evaluation(submission_path):
     thread.start()
     return True
 def extract_json_from_code_output(output: str):
     try:
         start_index = output.find('{')
@@ -78,7 +54,6 @@ def extract_json_from_code_output(output: str):
         return None
 def exec_code_minizinc(code: str, timeout_sec):
     """
     Executes a MiniZinc model string using the minizinc-python library.

 import datetime
 import time
 import json
 import tempfile
 import minizinc
+from datasets import load_dataset
+from huggingface_hub import HfApi, hf_hub_download
+import os
+import sys
+import subprocess
+import threading
+from pathlib import Path
+from src.config import DATASET_REPO_ID, DS_RESULTS_PATH, CPMPY_FRAMEWORK, ORTOOLS_FRAMEWORK, \
+    MINIZINC_FRAMEWORK
 # --- Configuration ---
 # Timeout for running individual model scripts (both generated and modified ground-truth)
 SCRIPT_EXECUTION_TIMEOUT = 60  # seconds
 def run_evaluation(submission_path):
     print(f"Starting evaluation for: {submission_path}")
     main_eval(DATASET_REPO_ID, submission_path, DS_RESULTS_PATH)
     print(f"Evaluation process complete for: {submission_path}", flush=True)
     thread.start()
     return True
 def extract_json_from_code_output(output: str):
     try:
         start_index = output.find('{')
         return None
 def exec_code_minizinc(code: str, timeout_sec):
     """
     Executes a MiniZinc model string using the minizinc-python library.