Spaces:

Kazilsky
/

Petal

Runtime error

Kazilsky commited on Apr 24

Commit

2864cb2

verified ·

1 Parent(s): 055cf9a

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -4,24 +4,28 @@ import torch
 import gradio as gr
 # --- Конфиг ---
-MODEL_ID = "deepseek-ai/DeepSeek-V3-0324"
-# --- Загрузка модели ---
 @spaces.GPU
 def load_model():
-    model = AutoModelForCausalLM.from_pretrained(
-        MODEL_ID,
-        device_map="auto",
-        torch_dtype=torch.bfloat16,  # Оптимально для T4/A10G
-        trust_remote_code=True
-    )
-    tokenizer = AutoTokenizer.from_pretrained(MODEL_ID)
     return model, tokenizer
-model, tokenizer = load_model()
 # --- Генерация ---
 def generate(prompt: str) -> str:
     inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
     outputs = model.generate(
         **inputs,
@@ -36,4 +40,4 @@ with gr.Blocks() as demo:
     gr.ChatInterface(generate)
 if __name__ == "__main__":
-    demo.launch()

 import gradio as gr
 # --- Конфиг ---
+MODEL_ID = "deepseek-ai/deepseek-llm-7b"
+# --- Загрузка модели (ленивая) ---
+model = None
+tokenizer = None
 @spaces.GPU
 def load_model():
+    global model, tokenizer
+    if model is None:
+        model = AutoModelForCausalLM.from_pretrained(
+            MODEL_ID,
+            device_map="auto",
+            torch_dtype=torch.bfloat16,
+            trust_remote_code=True
+        )
+        tokenizer = AutoTokenizer.from_pretrained(MODEL_ID)
     return model, tokenizer
 # --- Генерация ---
 def generate(prompt: str) -> str:
+    model, tokenizer = load_model()  # Загружаем только при первом вызове
     inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
     outputs = model.generate(
         **inputs,
     gr.ChatInterface(generate)
 if __name__ == "__main__":
+    demo.launch()