Spaces:

jjvelezo
/

final-agent-course

Sleeping

App Files Files Community

jjvelezo commited on May 1

Commit

5bafa85

verified ·

1 Parent(s): 80a9980

Update agent.py

Browse files

Files changed (1) hide show

agent.py +40 -18

agent.py CHANGED Viewed

@@ -9,9 +9,10 @@ MODEL_NAME = os.getenv("MODEL_NAME", "google/gemma-2b-it")
 print("HF_TOKEN desde agent.py:", HF_TOKEN[:10] if HF_TOKEN else "NO DEFINIDO")
 # Función para llamar al modelo y obtener respuesta
-def call_model(prompt):
     """
     Llama al modelo de Hugging Face y devuelve la respuesta generada.
     """
     headers = {
         "Authorization": f"Bearer {HF_TOKEN}",
@@ -22,23 +23,44 @@ def call_model(prompt):
         "parameters": {"max_new_tokens": 512}
     }
-    try:
-        response = requests.post(
-            f"https://api-inference.huggingface.co/models/{MODEL_NAME}",
-            headers=headers,
-            json=payload,
-            timeout=60
-        )
-        result = response.json()
-        if isinstance(result, dict) and result.get("error"):
-            raise ValueError(f"Error al procesar la solicitud: {result['error']}")
-        return result[0]["generated_text"] if isinstance(result, list) else result
-    except requests.exceptions.RequestException as e:
-        raise ValueError(f"Error de conexión con el modelo: {str(e)}")
-    except Exception as e:
-        raise ValueError(f"Error al obtener respuesta del modelo: {str(e)}")
-# Función para esperar que el modelo esté listo
 def wait_for_model():
     """
     Espera hasta que el modelo esté completamente cargado y disponible para hacer solicitudes.

 print("HF_TOKEN desde agent.py:", HF_TOKEN[:10] if HF_TOKEN else "NO DEFINIDO")
 # Función para llamar al modelo y obtener respuesta
+def call_model(prompt, max_retries=5, wait_seconds=10):
     """
     Llama al modelo de Hugging Face y devuelve la respuesta generada.
+    Reintenta si el modelo aún se está cargando.
     """
     headers = {
         "Authorization": f"Bearer {HF_TOKEN}",
         "parameters": {"max_new_tokens": 512}
     }
+    for attempt in range(1, max_retries + 1):
+        try:
+            response = requests.post(
+                f"https://api-inference.huggingface.co/models/{MODEL_NAME}",
+                headers=headers,
+                json=payload,
+                timeout=60
+            )
+            result = response.json()
+            # Verificar si hay un error
+            if isinstance(result, dict) and result.get("error"):
+                error_msg = result["error"]
+                print(f"[Intento {attempt}] Error del modelo: {error_msg}")
+                if "is currently loading" in error_msg and attempt < max_retries:
+                    print(f"🔁 Esperando {wait_seconds} segundos antes de reintentar...")
+                    time.sleep(wait_seconds)
+                    continue
+                else:
+                    raise ValueError(f"Error al procesar la solicitud: {error_msg}")
+            # Respuesta válida
+            return result[0]["generated_text"] if isinstance(result, list) else result
+        except requests.exceptions.RequestException as e:
+            print(f"[Intento {attempt}] Error de red: {e}")
+            if attempt < max_retries:
+                time.sleep(wait_seconds)
+                continue
+            else:
+                raise ValueError(f"Error de conexión con el modelo: {str(e)}")
+        except Exception as e:
+            raise ValueError(f"Error al obtener respuesta del modelo: {str(e)}")
 def wait_for_model():
     """
     Espera hasta que el modelo esté completamente cargado y disponible para hacer solicitudes.