Spaces:

Priyanshukr-1
/

openhermes_mistral_API

Sleeping

Priyanshukr-1 commited on 29 days ago

Commit

347340b

verified ·

1 Parent(s): 630d5e2

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -188,15 +188,19 @@ async def generate(request: Request):
     try:
         response = llm.create_chat_completion(
             messages=messages_for_llm,
-            max_tokens=300,  # Keep response length short for maximum speed
             temperature=0.7, # Adjust temperature for creativity vs. coherence (0.0-1.0)
             stop=["</s>"] # Stop sequence for TinyLlama Chat
         )
         ai_response_content = response["choices"][0]["message"]["content"].strip()
         logger.info("✅ Response generated successfully.")
         return {
             "response": ai_response_content,
-            "prompt_tokens": prompt_tokens # Return tokens in the prompt
         }
     except Exception as e:
         logger.error(f"❌ Error during generation: {e}", exc_info=True) # Log exception details

     try:
         response = llm.create_chat_completion(
             messages=messages_for_llm,
+            max_tokens=1024,  # Keep response length short for maximum speed
             temperature=0.7, # Adjust temperature for creativity vs. coherence (0.0-1.0)
             stop=["</s>"] # Stop sequence for TinyLlama Chat
         )
         ai_response_content = response["choices"][0]["message"]["content"].strip()
+        response_token_count = count_tokens_in_text(ai_response_content)
         logger.info("✅ Response generated successfully.")
         return {
             "response": ai_response_content,
+            "prompt_tokens": prompt_tokens, # Return tokens in the prompt
+            "response_token_count": response_token_count
         }
     except Exception as e:
         logger.error(f"❌ Error during generation: {e}", exc_info=True) # Log exception details