FinalTest

Runtime error

App Files Files Community

yoshizen commited on May 29

Commit

0d4c845

verified ·

1 Parent(s): 7c56a86

Update app.py

Browse files

Files changed (1) hide show

app.py +110 -59

app.py CHANGED Viewed

@@ -7,6 +7,8 @@ import json
 import logging
 import time
 import sys
 # Настройка логирования
 logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(name)s - %(levelname)s - %(message)s')
@@ -14,43 +16,81 @@ logger = logging.getLogger("GAIA-Mastermind")
 # Конфигурация
 DEFAULT_API_URL = "https://agents-course-unit4-scoring.hf.space"
-MODEL_NAME = "google/flan-t5-base"  # Упрощенная модель для быстрой работы
 API_RETRIES = 3
 API_TIMEOUT = 30
 class GAIAExpert:
     def __init__(self):
-        self.device = "cuda" if torch.cuda.is_available() else "cpu"
-        logger.info(f"Инициализация модели на {self.device.upper()}")
-        try:
             self.tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
-            self.model = AutoModelForSeq2SeqLM.from_pretrained(
-                MODEL_NAME,
-                torch_dtype=torch.float32,
-                low_cpu_mem_usage=True
-            ).eval()
-            logger.info("Модель готова")
-        except Exception as e:
-            logger.exception("Ошибка загрузки модели")
-            raise RuntimeError(f"Ошибка инициализации: {str(e)}")
     def process_question(self, question: str) -> str:
-        """Обработка вопроса с минимальной задержкой"""
         try:
             inputs = self.tokenizer(
                 f"Вопрос: {question}\nОтвет:",
                 return_tensors="pt",
                 max_length=256,
-                truncation=True
             )
-            outputs = self.model.generate(
-                **inputs,
-                max_new_tokens=50,
-                num_beams=1,  # Ускорение генерации
-                early_stopping=True
-            )
             answer = self.tokenizer.decode(outputs[0], skip_special_tokens=True)
             return json.dumps({"final_answer": answer.strip()})
@@ -64,13 +104,16 @@ class GAIAEvaluator:
         self.submit_url = f"{api_url}/submit"
         self.session = requests.Session()
         self.session.headers.update({"Content-Type": "application/json"})
     def run_evaluation(self, username: str, agent_code: str):
         """Консольный процесс оценки без интерфейса"""
         agent = GAIAExpert()
-        # Получение вопросов
-        questions = self._fetch_questions()
         if not isinstance(questions, list):
             logger.error(f"Ошибка получения вопросов: {questions}")
             return 0, 0
@@ -98,42 +141,50 @@ class GAIAEvaluator:
                     "answer": f"ERROR: {str(e)}"
                 })
-        # Отправка ответов
-        return self._submit_answers(username, agent_code, answers)
-    def _fetch_questions(self):
-        """Получение вопросов с API"""
-        try:
-            response = self.session.get(self.questions_url, timeout=API_TIMEOUT)
-            if response.status_code == 200:
-                return response.json()
-            return f"HTTP error {response.status_code}"
-        except Exception as e:
-            return f"Connection error: {str(e)}"
-    def _submit_answers(self, username: str, agent_code: str, answers: list):
-        """Отправка ответов на сервер"""
-        try:
-            payload = {
-                "username": username.strip(),
-                "agent_code": agent_code.strip(),
-                "answers": answers
-            }
-            response = self.session.post(
-                self.submit_url,
-                json=payload,
-                timeout=API_TIMEOUT * 2
-            )
-            if response.status_code == 200:
-                result = response.json()
-                score = result.get("score", 0)
-                return score, len(answers)
-            return 0, len(answers)
-        except Exception as e:
-            logger.error(f"Ошибка отправки: {str(e)}")
-            return 0, len(answers)
 if __name__ == "__main__":
     # Параметры запуска
@@ -153,4 +204,4 @@ if __name__ == "__main__":
     if total > 0:
         logger.info(f"Точность: {score/total*100:.1f}%")
     else:
-        logger.error("Не удалось обработать ни одного вопроса")

 import logging
 import time
 import sys
+import os
+from functools import lru_cache
 # Настройка логирования
 logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(name)s - %(levelname)s - %(message)s')
 # Конфигурация
 DEFAULT_API_URL = "https://agents-course-unit4-scoring.hf.space"
+MODEL_NAME = "google/flan-t5-base"  # Используем меньшую модель для быстрой загрузки
 API_RETRIES = 3
 API_TIMEOUT = 30
+# Настройка кэширования моделей
+os.environ["TRANSFORMERS_CACHE"] = "/tmp/transformers_cache"
+os.environ["HF_HOME"] = "/tmp/hf_home"
 class GAIAExpert:
+    _instance = None
+    _is_initialized = False
+    def __new__(cls):
+        # Паттерн Singleton для предотвращения повторной загрузки модели
+        if cls._instance is None:
+            cls._instance = super(GAIAExpert, cls).__new__(cls)
+        return cls._instance
     def __init__(self):
+        # Инициализируем только один раз
+        if not GAIAExpert._is_initialized:
+            self.device = "cuda" if torch.cuda.is_available() else "cpu"
+            logger.info(f"Инициализация модели на {self.device.upper()}")
+            # Отложенная инициализация - токенизатор загружаем сразу, модель - по требованию
             self.tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
+            self.model = None
+            GAIAExpert._is_initialized = True
+    def _ensure_model_loaded(self):
+        """Ленивая загрузка модели только при необходимости"""
+        if self.model is None:
+            try:
+                logger.info("Загрузка модели...")
+                # Оптимизированная загрузка модели
+                self.model = AutoModelForSeq2SeqLM.from_pretrained(
+                    MODEL_NAME,
+                    torch_dtype=torch.float16 if self.device == "cuda" else torch.float32,
+                    low_cpu_mem_usage=True,
+                    device_map="auto"  # Автоматическое распределение на доступные устройства
+                ).eval()
+                logger.info("Модель успешно загружена")
+            except Exception as e:
+                logger.exception("Ошибка загрузки модели")
+                raise RuntimeError(f"Ошибка инициализации: {str(e)}")
+    @lru_cache(maxsize=100)  # Кэширование ответов для повторяющихся вопросов
     def process_question(self, question: str) -> str:
+        """Обработка вопроса с оптимизацией и кэшированием"""
         try:
+            # Загружаем модель только при первом вызове
+            self._ensure_model_loaded()
+            # Оптимизированная обработка токенов
             inputs = self.tokenizer(
                 f"Вопрос: {question}\nОтвет:",
                 return_tensors="pt",
                 max_length=256,
+                truncation=True,
+                padding="max_length"
             )
+            # Перемещаем тензоры на нужное устройство
+            if self.device == "cuda":
+                inputs = {k: v.to(self.device) for k, v in inputs.items()}
+            # Оптимизированная генерация
+            with torch.no_grad():  # Отключаем вычисление градиентов для экономии памяти
+                outputs = self.model.generate(
+                    **inputs,
+                    max_new_tokens=50,
+                    num_beams=1,  # Ускорение генерации
+                    early_stopping=True,
+                    do_sample=False  # Детерминированная генерация для скорости
+                )
             answer = self.tokenizer.decode(outputs[0], skip_special_tokens=True)
             return json.dumps({"final_answer": answer.strip()})
         self.submit_url = f"{api_url}/submit"
         self.session = requests.Session()
         self.session.headers.update({"Content-Type": "application/json"})
+        # Настройка повторных попыток и таймаутов
+        self.session.mount('https://', requests.adapters.HTTPAdapter(max_retries=API_RETRIES))
     def run_evaluation(self, username: str, agent_code: str):
         """Консольный процесс оценки без интерфейса"""
+        # Создаем агента только при необходимости
         agent = GAIAExpert()
+        # Получение вопросов с повторными попытками
+        questions = self._fetch_questions_with_retry()
         if not isinstance(questions, list):
             logger.error(f"Ошибка получения вопросов: {questions}")
             return 0, 0
                     "answer": f"ERROR: {str(e)}"
                 })
+        # Отправка ответов с повторными попытками
+        return self._submit_answers_with_retry(username, agent_code, answers)
+    def _fetch_questions_with_retry(self, max_retries=3):
+        """Получение вопросов с API с повторными попытками"""
+        for attempt in range(max_retries):
+            try:
+                response = self.session.get(self.questions_url, timeout=API_TIMEOUT)
+                if response.status_code == 200:
+                    return response.json()
+                logger.warning(f"HTTP error {response.status_code}, попытка {attempt+1}/{max_retries}")
+                time.sleep(2 ** attempt)  # Экспоненциальная задержка между попытками
+            except Exception as e:
+                logger.warning(f"Connection error: {str(e)}, попытка {attempt+1}/{max_retries}")
+                time.sleep(2 ** attempt)
+        return f"Failed after {max_retries} attempts"
+    def _submit_answers_with_retry(self, username: str, agent_code: str, answers: list, max_retries=3):
+        """Отправка ответов на сервер с повторными попытками"""
+        for attempt in range(max_retries):
+            try:
+                payload = {
+                    "username": username.strip(),
+                    "agent_code": agent_code.strip(),
+                    "answers": answers
+                }
+                response = self.session.post(
+                    self.submit_url,
+                    json=payload,
+                    timeout=API_TIMEOUT * 2
+                )
+                if response.status_code == 200:
+                    result = response.json()
+                    score = result.get("score", 0)
+                    return score, len(answers)
+                logger.warning(f"HTTP error {response.status_code}, попытка {attempt+1}/{max_retries}")
+                time.sleep(2 ** attempt)
+            except Exception as e:
+                logger.error(f"Ошибка отправки: {str(e)}, попытка {attempt+1}/{max_retries}")
+                time.sleep(2 ** attempt)
+        return 0, len(answers)
 if __name__ == "__main__":
     # Параметры запуска
     if total > 0:
         logger.info(f"Точность: {score/total*100:.1f}%")
     else:
+        logger.error("Не удалось обработать ни одного вопроса")