Spaces:

akiko19191
/

Better_tool_calling

Running

App Files Files Community

akiko19191 commited on Apr 29

Commit

73193bb

verified ·

1 Parent(s): ccb8dba

Update utils/llms.py

Browse files

Files changed (1) hide show

utils/llms.py +18 -3

utils/llms.py CHANGED Viewed

@@ -12,10 +12,10 @@ groq_api_keys=json.loads(os.environ.get("GROQ_API_KEYS"))
 chutes_key=os.environ.get("CHUTES_API_KEY")
 github_key=os.environ.get("GITHUB_API_KEY")
-DeepInfraChat.models = ["google/gemma-3-27b-it","deepseek-ai/DeepSeek-R1-Turbo","Qwen/QwQ-32B","deepseek-ai/DeepSeek-R1","deepseek-ai/DeepSeek-V3-0324","meta-llama/Llama-4-Maverick-17B-128E-Instruct-FP8","meta-llama/Llama-4-Scout-17B-16E-Instruct","microsoft/Phi-4-multimodal-instruct"]
 deepinframodels=["meta-llama/Llama-4-Maverick-17B-128E-Instruct-FP8","microsoft/Phi-4-multimodal-instruct","google/gemma-3-27b-it","meta-llama/Llama-4-Scout-17B-16E-Instruct"]
-chutes_models={"MAI-DS-R1-FP8":"microsoft/MAI-DS-R1-FP8","DeepSeek-V3-0324":"deepseek-ai/DeepSeek-V3-0324","deepseek-reasoner":"deepseek-ai/DeepSeek-R1","GLM-4-32B-0414":"THUDM/GLM-4-32B-0414","GLM-Z1-32B-0414":"THUDM/GLM-Z1-32B-0414","DeepSeek-R1T-Chimera":"tngtech/DeepSeek-R1T-Chimera", "DeepSeek-R1-Zero":"deepseek-ai/DeepSeek-R1-Zero", "QwQ-32B-ArliAI-RpR-v1":"ArliAI/QwQ-32B-ArliAI-RpR-v1"}
 github_models={"gpt4.1":"gpt-4.1","gpt-4o":"gpt-4o","o4-mini":"o4-mini"}
 REASONING_CORRESPONDANCE = {"DeepSeek-R1-Glider":Glider, "DeepSeekR1-LAMBDA":LambdaChat,"DeepSeekR1":DeepInfraChat,"deepseek-slow":TypeGPT}
@@ -66,7 +66,22 @@ def chatstream(messages,model,api_keys):
         except Exception as e:
             pass
         yield ("RESULT: "+cunk)
     elif model == "DeepSeekR1-togetherAI":
         response = completion(model="together_ai/deepseek-ai/DeepSeek-R1", messages=messages, stream=True)
@@ -260,4 +275,4 @@ def chatstream(messages,model,api_keys):
             except Exception as e:
                 pass
         print("STOPPING")
-        yield("RESULT: "+cunk)

 chutes_key=os.environ.get("CHUTES_API_KEY")
 github_key=os.environ.get("GITHUB_API_KEY")
+DeepInfraChat.models = ["Qwen/Qwen3-235B-A22B","Qwen/Qwen3-30B-A3B","Qwen/Qwen3-32B","google/gemma-3-27b-it","deepseek-ai/DeepSeek-R1-Turbo","Qwen/QwQ-32B","deepseek-ai/DeepSeek-R1","deepseek-ai/DeepSeek-V3-0324","meta-llama/Llama-4-Maverick-17B-128E-Instruct-FP8","meta-llama/Llama-4-Scout-17B-16E-Instruct","microsoft/Phi-4-multimodal-instruct"]
 deepinframodels=["meta-llama/Llama-4-Maverick-17B-128E-Instruct-FP8","microsoft/Phi-4-multimodal-instruct","google/gemma-3-27b-it","meta-llama/Llama-4-Scout-17B-16E-Instruct"]
+chutes_models={"Qwen3-235B":"Qwen/Qwen3-235B-A22B","MAI-DS-R1-FP8":"microsoft/MAI-DS-R1-FP8","DeepSeek-V3-0324":"deepseek-ai/DeepSeek-V3-0324","deepseek-reasoner":"deepseek-ai/DeepSeek-R1","GLM-4-32B-0414":"THUDM/GLM-4-32B-0414","GLM-Z1-32B-0414":"THUDM/GLM-Z1-32B-0414","DeepSeek-R1T-Chimera":"tngtech/DeepSeek-R1T-Chimera", "DeepSeek-R1-Zero":"deepseek-ai/DeepSeek-R1-Zero"}
 github_models={"gpt4.1":"gpt-4.1","gpt-4o":"gpt-4o","o4-mini":"o4-mini"}
 REASONING_CORRESPONDANCE = {"DeepSeek-R1-Glider":Glider, "DeepSeekR1-LAMBDA":LambdaChat,"DeepSeekR1":DeepInfraChat,"deepseek-slow":TypeGPT}
         except Exception as e:
             pass
         yield ("RESULT: "+cunk)
+    elif model == "Qwen3-235B-A22B" or model == "Qwen3-30B-A3B" or model == "Qwen3-32B":
+        try:
+            response = client.chat.completions.create(
+                provider=DeepInfraChat,
+                model=f"Qwen/{model}",
+                messages=messages,
+                stream=True
+            )
+            for part in response:
+                cunk=cunk+(part.choices[0].delta.content or "")
+                if "```json" not in cunk or "```" not in cunk:
+                    yield (part.choices[0].delta.content or "")
+        except Exception as e:
+            pass
+        yield ("RESULT: "+cunk)
     elif model == "DeepSeekR1-togetherAI":
         response = completion(model="together_ai/deepseek-ai/DeepSeek-R1", messages=messages, stream=True)
             except Exception as e:
                 pass
         print("STOPPING")
+        yield("RESULT: "+cunk)