Spaces:

Didier
/

Qwen3_chat_think_translate

Running on Zero

Didier commited on May 10

Commit

6108324

verified ·

1 Parent(s): de0ea79

Update llm.py

Files changed (1) hide show

llm.py CHANGED Viewed

@@ -9,6 +9,7 @@ from transformers import AutoTokenizer, AutoModelForCausalLM
 from transformers import TextIteratorStreamer
 import threading
 import torch
 import logging
 logger = logging.getLogger(__name__)
@@ -79,6 +80,7 @@ def build_messages(
 #
 # Stream response
 #
 @torch.inference_mode()
 def stream_response(
         messages: list[dict],

 from transformers import TextIteratorStreamer
 import threading
 import torch
+import spaces
 import logging
 logger = logging.getLogger(__name__)
 #
 # Stream response
 #
+@spaces.GPU
 @torch.inference_mode()
 def stream_response(
         messages: list[dict],