ap2

Sleeping

Reality123b commited on Jan 29

Commit

5205e2c

verified ·

1 Parent(s): 3003014

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -5,7 +5,7 @@ import torch
 class ModelInput(BaseModel):
     prompt: str
-    max_new_tokens: int = 2048
 app = FastAPI()
@@ -13,13 +13,13 @@ app = FastAPI()
 generator = pipeline(
     "text-generation",
     model="deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B",
-    device=1  # Use CPU (change to device=0 for GPU)
 )
 # Create text streamer
 streamer = TextStreamer(generator.tokenizer, skip_prompt=True)
-def generate_response(prompt: str, max_new_tokens: int = 2048):
     try:
         messages = [{"role": "user", "content": prompt}]
         output = generator(messages, max_new_tokens=max_new_tokens, do_sample=False, streamer=streamer)

 class ModelInput(BaseModel):
     prompt: str
+    max_new_tokens: int = 64000
 app = FastAPI()
 generator = pipeline(
     "text-generation",
     model="deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B",
+    device=0  # Use CPU (change to device=0 for GPU)
 )
 # Create text streamer
 streamer = TextStreamer(generator.tokenizer, skip_prompt=True)
+def generate_response(prompt: str, max_new_tokens: int = 64000):
     try:
         messages = [{"role": "user", "content": prompt}]
         output = generator(messages, max_new_tokens=max_new_tokens, do_sample=False, streamer=streamer)