4b-demo

Running on Zero

sumuks HF Staff commited on 12 days ago

Commit

0440349

verified ·

1 Parent(s): bae72e4

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,7 +1,8 @@
 import gradio as gr
 import spaces
 import torch
-from transformers import AutoModel, AutoTokenizer, AutoModelForCausalLM, AutoModelForSeq2SeqLM
 model_id = "textcleanlm/textclean-4B"
 model = None
@@ -37,19 +38,32 @@ def load_model():
 def clean_text(text):
     model, tokenizer = load_model()
-    inputs = tokenizer(text, return_tensors="pt", max_length=512, truncation=True)
     inputs = {k: v.cuda() for k, v in inputs.items()}
-    with torch.no_grad():
-        outputs = model.generate(
-            **inputs,
-            max_length=512,
-            num_beams=4,
-            early_stopping=True
-        )
-    cleaned_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
-    return cleaned_text
 iface = gr.Interface(
     fn=clean_text,

 import gradio as gr
 import spaces
 import torch
+from threading import Thread
+from transformers import AutoModel, AutoTokenizer, AutoModelForCausalLM, AutoModelForSeq2SeqLM, TextIteratorStreamer
 model_id = "textcleanlm/textclean-4B"
 model = None
 def clean_text(text):
     model, tokenizer = load_model()
+    inputs = tokenizer(text, return_tensors="pt", max_length=4096, truncation=True)
     inputs = {k: v.cuda() for k, v in inputs.items()}
+    # Enable streaming
+    streamer = TextIteratorStreamer(tokenizer, skip_special_tokens=True)
+    generation_kwargs = dict(
+        **inputs,
+        max_length=4096,
+        num_beams=1,  # Set to 1 for streaming
+        do_sample=True,
+        temperature=1.0,
+        streamer=streamer,
+    )
+    # Run generation in a separate thread
+    thread = Thread(target=model.generate, kwargs=generation_kwargs)
+    thread.start()
+    # Yield text as it's generated
+    generated_text = ""
+    for new_text in streamer:
+        generated_text += new_text
+        yield generated_text
+    thread.join()
 iface = gr.Interface(
     fn=clean_text,