Spaces:

hsuwill000
/

DeepSeek-R1-Distill-Qwen-1.5B-openvino

Running

hsuwill000 commited on Feb 3

Commit

c9ac48b

verified ·

1 Parent(s): 9c592ef

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -16,19 +16,27 @@ def respond(message):
         # Record the start time
         start_time = time.time()
-        # Only use the current message as input (no history)
-        input_text = f"User: {message}"
         # Generate response
         response = pipe(
             input_text,
-            max_length=4096,
             truncation=True,
             num_return_sequences=1,
             temperature=0.2,  # 控制生成多样性
             top_p=0.1,        # 控制生成质量
         )
-        reply = response[0]['generated_text'].strip()
         # Calculate inference time
         inference_time = time.time() - start_time

         # Record the start time
         start_time = time.time()
+        # 修改 prompt：在對話中加入指令，要求只輸出最終答案，不顯示推理過程
+        instruction = "請只輸出最終答案，不要展示任何中間推理過程。"
+        input_text = f"User: {message}\nAssistant: {instruction}\nAssistant:"
         # Generate response
         response = pipe(
             input_text,
+            max_length=1024,
             truncation=True,
             num_return_sequences=1,
             temperature=0.2,  # 控制生成多样性
             top_p=0.1,        # 控制生成质量
         )
+        generated_text = response[0]['generated_text'].strip()
+        # 提取模型輸出中最後一次出現 "Assistant:" 之後的部分（假設模型按照格式輸出）
+        # 若模型輸出格式不同，可根據實際情況進行調整
+        if "Assistant:" in generated_text:
+            reply = generated_text.split("Assistant:")[-1].strip()
+        else:
+            reply = generated_text
         # Calculate inference time
         inference_time = time.time() - start_time