Spaces:

Yixin1234
/

minicode

Sleeping

Yixin1234 commited on 3 days ago

Commit

8f77b64

1 Parent(s): 3382272

try to fix api errors

Files changed (2) hide show

app.py CHANGED Viewed

@@ -4,6 +4,8 @@ from deepseek_vl.utils.io import load_pil_images
 import torch
 model_path = "deepseek-ai/deepseek-vl-1.3b-chat"
 vl_chat_processor = VLChatProcessor.from_pretrained(model_path)
 tokenizer = vl_chat_processor.tokenizer
 vl_gpt = MultiModalityCausalLM.from_pretrained(model_path, trust_remote_code=True).to("cpu")
@@ -19,6 +21,7 @@ def qa(image, question):
         images=pil_images,
         force_batchify=True
     ).to("cpu")
     inputs_embeds = vl_gpt.prepare_inputs_embeds(**prepare_inputs)
     outputs = vl_gpt.language_model.generate(
         inputs_embeds=inputs_embeds,
@@ -26,7 +29,7 @@ def qa(image, question):
         pad_token_id=tokenizer.eos_token_id,
         bos_token_id=tokenizer.bos_token_id,
         eos_token_id=tokenizer.eos_token_id,
-        max_new_tokens=512,
         do_sample=False,
         use_cache=True
     )
@@ -41,8 +44,6 @@ demo = gr.Interface(
     description="Upload an image and enter a question. Experience DeepSeek-VL's vision-language capabilities."
 )
-demo.launch(
-    server_name="0.0.0.0",
-    server_port=7860,
-    share=True
-)

 import torch
 model_path = "deepseek-ai/deepseek-vl-1.3b-chat"
+# Load processors and model (CPU on free Spaces)
 vl_chat_processor = VLChatProcessor.from_pretrained(model_path)
 tokenizer = vl_chat_processor.tokenizer
 vl_gpt = MultiModalityCausalLM.from_pretrained(model_path, trust_remote_code=True).to("cpu")
         images=pil_images,
         force_batchify=True
     ).to("cpu")
     inputs_embeds = vl_gpt.prepare_inputs_embeds(**prepare_inputs)
     outputs = vl_gpt.language_model.generate(
         inputs_embeds=inputs_embeds,
         pad_token_id=tokenizer.eos_token_id,
         bos_token_id=tokenizer.bos_token_id,
         eos_token_id=tokenizer.eos_token_id,
+        max_new_tokens=256,   # smaller is faster on CPU
         do_sample=False,
         use_cache=True
     )
     description="Upload an image and enter a question. Experience DeepSeek-VL's vision-language capabilities."
 )
+if __name__ == "__main__":
+    # No server_name/server_port/share on Spaces
+    demo.queue(concurrency_count=1, max_size=8).launch()

requirements.txt CHANGED Viewed

@@ -1,4 +1,7 @@
-gradio
-torch
-transformers
 git+https://github.com/deepseek-ai/DeepSeek-VL.git

+gradio>=4.31.0
+transformers>=4.40.0
+torch>=2.2.0
+sentencepiece
+timm>=0.9.16
+accelerate
 git+https://github.com/deepseek-ai/DeepSeek-VL.git