Spaces:

Athspi
/

Athspi-promax

Sleeping

App Files Files Community

Athspi commited on Feb 5

Commit

08f78da

verified ·

1 Parent(s): 04c06dd

Update app.py

Browse files

Files changed (1) hide show

app.py +26 -38

app.py CHANGED Viewed

@@ -4,24 +4,18 @@ import json
 import httpx
 import gradio as gr
 from huggingface_hub import InferenceClient
-from openai import OpenAI
 from dotenv import load_dotenv
 # Load API keys from .env file
 load_dotenv()
-HF_API_KEY = os.getenv("HF_API_KEY")
-OPENROUTER_API_KEY = os.getenv("OPENROUTER_API_KEY")
 # Initialize Hugging Face Clients
 hf_client = InferenceClient(provider="hf-inference", api_key=HF_API_KEY)
-# Initialize OpenRouter DeepSeek Client
-openrouter_client = OpenAI(
-    base_url="https://openrouter.ai/api/v1",
-    api_key=OPENROUTER_API_KEY
-)
-# Query Hugging Face Models
 def query_huggingface_model(user_input, model_name):
     try:
         messages = [{"role": "user", "content": user_input}]
@@ -34,30 +28,32 @@ def query_huggingface_model(user_input, model_name):
     except Exception as e:
         return f"Error querying {model_name}: {str(e)}"
-# Query DeepSeek-R1 (OpenRouter)
-def query_deepseek(user_input):
     try:
-        completion = openrouter_client.chat.completions.create(
-            model="deepseek/deepseek-r1:free",
-            messages=[{"role": "user", "content": user_input}]
         )
-        return completion.choices[0].message.content
     except Exception as e:
-        return f"Error querying DeepSeek: {str(e)}"
-# Function to refine responses using DeepSeek
 def refine_response(user_input):
     try:
         # Get responses from all three models
         gemma_response = query_huggingface_model(user_input, "google/gemma-2-27b-it")
         llama_response = query_huggingface_model(user_input, "meta-llama/Llama-3.3-70B-Instruct")
-        deepseek_response = query_deepseek(user_input)
         # If any response is missing, return the available ones
         responses = {
             "Gemma": gemma_response.strip(),
             "Llama": llama_response.strip(),
-            "DeepSeek": deepseek_response.strip()
         }
         valid_responses = {k: v for k, v in responses.items() if v}
@@ -70,36 +66,28 @@ def refine_response(user_input):
         Response 1 (Gemma): {gemma_response}
         Response 2 (Llama 3.3): {llama_response}
-        Response 3 (DeepSeek): {deepseek_response}
         Please combine the best elements of all three, improve clarity, and provide a final refined answer.
         """
-        # Retry loop for OpenRouter API
         max_retries = 3
         for attempt in range(max_retries):
             try:
-                response = httpx.post(
-                    "https://openrouter.ai/api/v1/chat/completions",
-                    headers={
-                        "Authorization": f"Bearer {OPENROUTER_API_KEY}",
-                        "Content-Type": "application/json"
-                    },
-                    json={
-                        "model": "deepseek/deepseek-r1:free",
-                        "messages": [{"role": "user", "content": improvement_prompt}]
-                    },
-                    timeout=30
                 )
-                print(f"Attempt {attempt + 1}: OpenRouter Response:", response.text)
-                response_json = response.json()
-                refined_content = response_json["choices"][0]["message"]["content"]
                 if refined_content.strip():
                     return refined_content
                 else:
-                    print("Received empty response from DeepSeek, retrying...")
                     time.sleep(2)
             except Exception as e:
@@ -117,7 +105,7 @@ iface = gr.Interface(
     inputs=gr.Textbox(lines=2, placeholder="Ask me anything..."),
     outputs="text",
     title="Multi-Model AI Enhancer",
-    description="Get responses from Gemma, Llama 3.3, and DeepSeek. Then receive an improved final answer."
 )
 # Launch app

 import httpx
 import gradio as gr
 from huggingface_hub import InferenceClient
 from dotenv import load_dotenv
 # Load API keys from .env file
 load_dotenv()
+HF_API_KEY = os.getenv("HF_API_KEY")  # Hugging Face API for Gemma & Llama
+TOGETHER_API_KEY = os.getenv("TOGETHER_API_KEY")  # Together AI API for DeepSeek-V3
 # Initialize Hugging Face Clients
 hf_client = InferenceClient(provider="hf-inference", api_key=HF_API_KEY)
+together_client = InferenceClient(provider="together", api_key=TOGETHER_API_KEY)
+# Query Hugging Face Models (Gemma & Llama)
 def query_huggingface_model(user_input, model_name):
     try:
         messages = [{"role": "user", "content": user_input}]
     except Exception as e:
         return f"Error querying {model_name}: {str(e)}"
+# Query DeepSeek-V3 (Together AI via Hugging Face)
+def query_deepseek_v3(user_input):
     try:
+        messages = [{"role": "user", "content": user_input}]
+        completion = together_client.chat.completions.create(
+            model="deepseek-ai/DeepSeek-V3",
+            messages=messages,
+            max_tokens=500
         )
+        return completion.choices[0].message["content"]
     except Exception as e:
+        return f"Error querying DeepSeek-V3: {str(e)}"
+# Function to refine responses using DeepSeek-V3
 def refine_response(user_input):
     try:
         # Get responses from all three models
         gemma_response = query_huggingface_model(user_input, "google/gemma-2-27b-it")
         llama_response = query_huggingface_model(user_input, "meta-llama/Llama-3.3-70B-Instruct")
+        deepseek_response = query_deepseek_v3(user_input)
         # If any response is missing, return the available ones
         responses = {
             "Gemma": gemma_response.strip(),
             "Llama": llama_response.strip(),
+            "DeepSeek-V3": deepseek_response.strip()
         }
         valid_responses = {k: v for k, v in responses.items() if v}
         Response 1 (Gemma): {gemma_response}
         Response 2 (Llama 3.3): {llama_response}
+        Response 3 (DeepSeek-V3): {deepseek_response}
         Please combine the best elements of all three, improve clarity, and provide a final refined answer.
         """
+        # Retry loop for DeepSeek-V3 refinement
         max_retries = 3
         for attempt in range(max_retries):
             try:
+                messages = [{"role": "user", "content": improvement_prompt}]
+                refined_completion = together_client.chat.completions.create(
+                    model="deepseek-ai/DeepSeek-V3",
+                    messages=messages,
+                    max_tokens=500
                 )
+                refined_content = refined_completion.choices[0].message["content"]
                 if refined_content.strip():
                     return refined_content
                 else:
+                    print("Received empty response from DeepSeek-V3, retrying...")
                     time.sleep(2)
             except Exception as e:
     inputs=gr.Textbox(lines=2, placeholder="Ask me anything..."),
     outputs="text",
     title="Multi-Model AI Enhancer",
+    description="Get responses from Gemma, Llama 3.3, and DeepSeek-V3. Then receive an improved final answer."
 )
 # Launch app