Spaces:

adriansanz
/

agents-4

Sleeping

App Files Files Community

adriansanz commited on Jul 29

Commit

5a8f9f0

verified ·

1 Parent(s): 6365a8a

Update app.py

Browse files

Files changed (1) hide show

app.py +32 -9

app.py CHANGED Viewed

@@ -285,23 +285,46 @@ def ask_youtube_video(url: str, objeto: str = "bird") -> str:
 from langchain_core.prompts import PromptTemplate
 from langchain.chains import LLMChain
 class BasicAgent:
     def __init__(self):
-        # Aquí GeminiLLM es tu LLM personalizado que usa la API Gemini
         self.llm = GeminiLLM()
         self.chain = LLMChain(prompt=PromptTemplate.from_template("{question}"), llm=self.llm)
         print("BasicAgent con GeminiLLM inicializado.")
     def __call__(self, question: str) -> str:
         print(f"Pregunta recibida: {question[:50]}...")
-        try:
-            respuesta = self.chain.run({"question": question})
-            print(f"Respuesta: {respuesta}")
-            return respuesta
-        except Exception as e:
-            print(f"Error: {e}")
-            return "Error procesando la pregunta."
 def run_and_submit_all(profile: gr.OAuthProfile | None):

 from langchain_core.prompts import PromptTemplate
 from langchain.chains import LLMChain
+import time
 class BasicAgent:
     def __init__(self):
         self.llm = GeminiLLM()
         self.chain = LLMChain(prompt=PromptTemplate.from_template("{question}"), llm=self.llm)
         print("BasicAgent con GeminiLLM inicializado.")
     def __call__(self, question: str) -> str:
         print(f"Pregunta recibida: {question[:50]}...")
+        max_retries = 5
+        backoff = 2  # segundos
+        for attempt in range(max_retries):
+            try:
+                respuesta = self.chain.run({"question": question})
+                print(f"Respuesta: {respuesta}")
+                return respuesta
+            except Exception as e:
+                error_str = str(e).lower()
+                print(f"Error en intento {attempt + 1}: {e}")
+                # Manejar error 503 específico
+                if "503" in error_str or "model is overloaded" in error_str:
+                    if attempt < max_retries - 1:
+                        print(f"Modelo saturado, reintentando en {backoff} segundos...")
+                        time.sleep(backoff)
+                        backoff *= 2
+                        continue
+                    else:
+                        return "El modelo está saturado. Por favor, inténtalo más tarde."
+                # Otros errores que pueden ser manejados
+                elif "quota" in error_str:
+                    return "Se ha superado la cuota de la API. Intenta nuevamente más tarde."
+                elif "timeout" in error_str:
+                    return "La solicitud tardó demasiado. Intenta nuevamente."
+                else:
+                    return "Error procesando la pregunta."
 def run_and_submit_all(profile: gr.OAuthProfile | None):