Spaces:

Priyanshukr-1
/

openhermes_mistral_API

Sleeping

Priyanshukr-1 commited on about 1 month ago

Commit

1fb027f

verified ·

1 Parent(s): 314bed8

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -29,7 +29,8 @@ else:
 llm = Llama(
     model_path=model_path,
     n_ctx=1024,
-    n_threads=4  # Adjust for your CPU
 )
 @app.get("/")
@@ -54,6 +55,8 @@ async def generate(request: Request):
     print("📤 Raw model response:", response)
     return {
         "response": response["choices"][0]["message"]["content"].strip()
     }

 llm = Llama(
     model_path=model_path,
     n_ctx=1024,
+    n_threads=os.cpu_count(),  # Adjust for your CPU
+    n_batch=64
 )
 @app.get("/")
     print("📤 Raw model response:", response)
+    llm.reset()
     return {
         "response": response["choices"][0]["message"]["content"].strip()
     }