Spaces:

hsuwill000
/

maxtest01

Running

App Files Files Community

hsuwill000 commited on Jul 1

Commit

3e39aa5

verified ·

1 Parent(s): b307fb6

Update app.py

Browse files

Files changed (1) hide show

app.py +12 -44

app.py CHANGED Viewed

@@ -11,30 +11,21 @@ model_path = "Qwen3-0.6B-int4-ov"
 hf_hub.snapshot_download(model_id, local_dir=model_path)
 pipe = ov_genai.LLMPipeline(model_path, "CPU")
-# === Gradio Callback Functions ===
-def start_chat():
-    print("🔄 start_chat() 被觸發")
-    pipe.start_chat()
-    return "Chat session started."
-def finish_chat():
-    print("🛑 finish_chat() 被觸發")
-    pipe.finish_chat()
-    return "Chat session ended."
 def generate_stream(prompt):
     q = queue.Queue()
     def streamer(subword):
-        print(subword, end="", flush=True)
         q.put(subword)
         return ov_genai.StreamingStatus.RUNNING
     def worker():
         pipe.generate([prompt], streamer=streamer, max_new_tokens=4096)
-        q.put(None)
     threading.Thread(target=worker).start()
@@ -44,9 +35,9 @@ def generate_stream(prompt):
         if token is None:
             break
         result += token
-        yield result
-# === Gradio UI ===
 with gr.Blocks(css="""
 #scrollbox textarea {
     overflow-y: auto !important;
@@ -55,38 +46,15 @@ with gr.Blocks(css="""
     white-space: pre-wrap;
 }
 """) as demo:
-    gr.Markdown("## 🧠 OpenVINO Streaming Chatbot with Lifecycle Control")
     textbox_input = gr.Textbox(label="Prompt", lines=1, placeholder="Enter prompt here...")
     textbox_output = gr.Textbox(label="Output", elem_id="scrollbox", lines=10)
-    # 隱藏按鈕控制生命周期
-    hidden_start_btn = gr.Button(visible=False)
-    hidden_end_btn = gr.Button(visible=False)
-    status_text = gr.Textbox(visible=False)
-    hidden_start_btn.click(fn=start_chat, outputs=status_text)
-    hidden_end_btn.click(fn=finish_chat, outputs=status_text)
     button = gr.Button("Submit")
-    button.click(fn=generate_stream, inputs=textbox_input, outputs=textbox_output)
-    # JavaScript 在頁面載入/離開時觸發
-    demo.load(
-        None,
-        _js="""
-            () => {
-                // 頁面載入時觸發 start_chat
-                document.querySelector('button[id^="component-"]').click();
-                // 離開時觸發 finish_chat
-                window.addEventListener("beforeunload", () => {
-                    document.querySelectorAll('button[id^="component-"]')[1].click();
-                });
-                return;
-            }
-        """
-    )
-demo.launch()

 hf_hub.snapshot_download(model_id, local_dir=model_path)
 pipe = ov_genai.LLMPipeline(model_path, "CPU")
+#pipe.start_chat()
+# 建立推論函式：使用 streamer 並回傳 generator 結果
 def generate_stream(prompt):
     q = queue.Queue()
     def streamer(subword):
+        print(subword, end='', flush=True)
         q.put(subword)
         return ov_genai.StreamingStatus.RUNNING
     def worker():
+        # 在背景 thread 中做推論
         pipe.generate([prompt], streamer=streamer, max_new_tokens=4096)
+        q.put(None)  # 結束符號
     threading.Thread(target=worker).start()
         if token is None:
             break
         result += token
+        yield result  # 把逐步結果傳給 output textbox
 with gr.Blocks(css="""
 #scrollbox textarea {
     overflow-y: auto !important;
     white-space: pre-wrap;
 }
 """) as demo:
+    gr.Markdown("## 🧠 OpenVINO Streaming Demo with Gradio Textbox")
     textbox_input = gr.Textbox(label="Prompt", lines=1, placeholder="Enter prompt here...")
     textbox_output = gr.Textbox(label="Output", elem_id="scrollbox", lines=10)
+    # 按鈕控制觸發推論
     button = gr.Button("Submit")
+    # 當按鈕被按下時，呼叫 generate_stream 並更新 textbox_output
+    button.click(fn=generate_stream, inputs=textbox_input, outputs=textbox_output)
+demo.launch()