Spaces:

hsuwill000
/

DeepSeek-R1-Distill-Qwen-1.5B-openvino

Running

hsuwill000 commited on Feb 3

Commit

0d30833

verified ·

1 Parent(s): 0e6fea8

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,4 +1,5 @@
 import gradio as gr
 from optimum.intel import OVModelForCausalLM
 from transformers import AutoTokenizer, pipeline
@@ -12,6 +13,9 @@ pipe = pipeline("text-generation", model=model, tokenizer=tokenizer)
 def respond(message):
     try:
         # Only use the current message as input (no history)
         input_text = f"User: {message}"
@@ -26,6 +30,10 @@ def respond(message):
         )
         reply = response[0]['generated_text'].strip()
         # Return as a tuple (user message, bot reply)
         return [(message, reply)]

 import gradio as gr
+import time
 from optimum.intel import OVModelForCausalLM
 from transformers import AutoTokenizer, pipeline
 def respond(message):
     try:
+        # Record the start time
+        start_time = time.time()
         # Only use the current message as input (no history)
         input_text = f"User: {message}"
         )
         reply = response[0]['generated_text'].strip()
+        # Calculate inference time
+        inference_time = time.time() - start_time
+        print(f"Inference time: {inference_time:.4f} seconds")
         # Return as a tuple (user message, bot reply)
         return [(message, reply)]