Spaces:

aldohenrique
/

portalprogramando

Running

App Files Files Community

aldohenrique commited on Jun 10

Commit

3153e8a

verified ·

1 Parent(s): 11dde31

Update app.py

Browse files

Files changed (1) hide show

app.py +76 -27

app.py CHANGED Viewed

@@ -9,16 +9,18 @@ HF_TOKEN = os.getenv("HF_TOKEN")
 if not HF_TOKEN:
     raise ValueError("Token HF_TOKEN não encontrado nas variáveis de ambiente")
-# Modelos disponíveis via API (escolha um que funcione bem em português)
 MODELS = {
-    "qwen2.5-7b": "Qwen/Qwen2.5-7B-Instruct",
-    "llama3.1-8b": "meta-llama/Llama-3.1-8B-Instruct",
-    "mistral-7b": "mistralai/Mistral-7B-Instruct-v0.3",
-    "gemma2-9b": "google/gemma-2-9b-it"
 }
-# Modelo padrão
-DEFAULT_MODEL = MODELS["qwen2.5-7b"]
 class HuggingFaceAPIClient:
     def __init__(self, token: str):
@@ -69,21 +71,46 @@ class HuggingFaceAPIClient:
                 "top_p": 0.9,
                 "do_sample": True,
                 "return_full_text": False
             }
         }
         try:
-            response = requests.post(url, headers=self.headers, json=payload, timeout=30)
             if response.status_code == 200:
                 result = response.json()
                 if isinstance(result, list) and len(result) > 0:
-                    return result[0].get("generated_text", "Resposta vazia")
-                else:
-                    return "Formato de resposta inesperado"
             else:
-                return f"Erro HTTP {response.status_code}: {response.text}"
         except Exception as e:
             return f"Erro na requisição: {str(e)}"
@@ -137,17 +164,39 @@ def responder_como_aldo(pergunta: str, modelo_escolhido: str = "qwen2.5-7b") ->
     except Exception as e:
         return f"Erro ao processar sua pergunta: {str(e)}"
-def testar_conexao():
-    """Testa se a API está funcionando"""
     try:
-        test_response = api_client.query_model(
-            DEFAULT_MODEL,
-            [{"role": "user", "content": "Olá, apenas responda 'Conexão OK'"}],
-            max_tokens=50
-        )
-        return f"✅ Conexão OK: {test_response[:100]}..."
     except Exception as e:
-        return f"❌ Erro na conexão: {str(e)}"
 # Interface Gradio
 with gr.Blocks(title="Dr. Aldo Henrique - API Externa", theme=gr.themes.Soft()) as interface:
@@ -172,7 +221,7 @@ with gr.Blocks(title="Dr. Aldo Henrique - API Externa", theme=gr.themes.Soft())
             with gr.Row():
                 botao_perguntar = gr.Button("🤔 Perguntar", variant="primary")
-                botao_testar = gr.Button("🔍 Testar Conexão", variant="secondary")
         with gr.Column(scale=4):
             saida = gr.Textbox(
@@ -184,11 +233,11 @@ with gr.Blocks(title="Dr. Aldo Henrique - API Externa", theme=gr.themes.Soft())
     # Exemplos
     gr.Examples(
         examples=[
-            ["Como implementar uma lista ligada em C?", "qwen2.5-7b"],
-            ["Qual a diferença entre == e equals() em Java?", "qwen2.5-7b"],
-            ["Como funciona o machine learning?", "llama3.1-8b"],
             ["Explique os conceitos de HTML, CSS e JavaScript", "mistral-7b"],
-            ["O que são algoritmos de ordenação e qual é mais eficiente?", "gemma2-9b"]
         ],
         inputs=[entrada, modelo_select]
     )
@@ -208,7 +257,7 @@ with gr.Blocks(title="Dr. Aldo Henrique - API Externa", theme=gr.themes.Soft())
     )
     botao_testar.click(
-        fn=testar_conexao,
         outputs=status_api
     ).then(
         lambda: gr.update(visible=True),

 if not HF_TOKEN:
     raise ValueError("Token HF_TOKEN não encontrado nas variáveis de ambiente")
+# Modelos disponíveis via API (testados e funcionais)
 MODELS = {
+    "qwen2.5-3b": "Qwen/Qwen2.5-3B-Instruct",
+    "qwen2.5-1.5b": "Qwen/Qwen2.5-1.5B-Instruct",
+    "phi3-mini": "microsoft/Phi-3-mini-4k-instruct",
+    "llama3.2-3b": "meta-llama/Llama-3.2-3B-Instruct",
+    "gemma2-2b": "google/gemma-2-2b-it",
+    "mistral-7b": "mistralai/Mistral-7B-Instruct-v0.1"
 }
+# Modelo padrão (mais confiável)
+DEFAULT_MODEL = MODELS["qwen2.5-3b"]
 class HuggingFaceAPIClient:
     def __init__(self, token: str):
                 "top_p": 0.9,
                 "do_sample": True,
                 "return_full_text": False
+            },
+            "options": {
+                "wait_for_model": True,  # Espera modelo carregar
+                "use_cache": False
             }
         }
         try:
+            response = requests.post(url, headers=self.headers, json=payload, timeout=60)
             if response.status_code == 200:
                 result = response.json()
                 if isinstance(result, list) and len(result) > 0:
+                    generated_text = result[0].get("generated_text", "")
+                    # Limpa o texto gerado
+                    if generated_text:
+                        # Remove o prompt original da resposta
+                        if "Assistente: " in generated_text:
+                            parts = generated_text.split("Assistente: ")
+                            if len(parts) > 1:
+                                return parts[-1].strip()
+                        return generated_text.strip()
+                    return "Resposta vazia"
+                elif isinstance(result, dict):
+                    if "error" in result:
+                        return f"Erro do modelo: {result['error']}"
+                    elif "generated_text" in result:
+                        return result["generated_text"].strip()
+                return "Formato de resposta inesperado"
+            elif response.status_code == 404:
+                return f"❌ Modelo '{model_name}' não encontrado. Tente outro modelo."
+            elif response.status_code == 503:
+                return "⏳ Modelo carregando... Aguarde alguns segundos e tente novamente."
+            elif response.status_code == 429:
+                return "⚠️ Muitas requisições. Aguarde um momento antes de tentar novamente."
             else:
+                return f"Erro HTTP {response.status_code}: {response.text[:200]}..."
+        except requests.Timeout:
+            return "⏰ Timeout - Modelo demorou muito para responder. Tente novamente."
         except Exception as e:
             return f"Erro na requisição: {str(e)}"
     except Exception as e:
         return f"Erro ao processar sua pergunta: {str(e)}"
+def verificar_modelo_disponivel(model_name: str) -> str:
+    """Verifica se um modelo está disponível na API"""
     try:
+        url = f"https://api-inference.huggingface.co/models/{model_name}"
+        headers = {"Authorization": f"Bearer {HF_TOKEN}"}
+        # Teste simples
+        payload = {
+            "inputs": "Hello",
+            "parameters": {"max_new_tokens": 5}
+        }
+        response = requests.post(url, headers=headers, json=payload, timeout=10)
+        if response.status_code == 200:
+            return "✅ Disponível"
+        elif response.status_code == 404:
+            return "❌ Não encontrado"
+        elif response.status_code == 503:
+            return "⏳ Carregando..."
+        else:
+            return f"⚠️ Status {response.status_code}"
     except Exception as e:
+        return f"❌ Erro: {str(e)[:50]}..."
+def testar_todos_modelos():
+    """Testa todos os modelos disponíveis"""
+    resultados = []
+    for nome, modelo in MODELS.items():
+        status = verificar_modelo_disponivel(modelo)
+        resultados.append(f"{nome}: {status}")
+    return "\n".join(resultados)
 # Interface Gradio
 with gr.Blocks(title="Dr. Aldo Henrique - API Externa", theme=gr.themes.Soft()) as interface:
             with gr.Row():
                 botao_perguntar = gr.Button("🤔 Perguntar", variant="primary")
+                botao_testar = gr.Button("🔍 Testar Modelos", variant="secondary")
         with gr.Column(scale=4):
             saida = gr.Textbox(
     # Exemplos
     gr.Examples(
         examples=[
+            ["Como implementar uma lista ligada em C?", "qwen2.5-3b"],
+            ["Qual a diferença entre == e equals() em Java?", "phi3-mini"],
+            ["Como funciona o machine learning?", "llama3.2-3b"],
             ["Explique os conceitos de HTML, CSS e JavaScript", "mistral-7b"],
+            ["O que são algoritmos de ordenação e qual é mais eficiente?", "gemma2-2b"]
         ],
         inputs=[entrada, modelo_select]
     )
     )
     botao_testar.click(
+        fn=testar_todos_modelos,
         outputs=status_api
     ).then(
         lambda: gr.update(visible=True),