Spaces:

mrstarkng
/

vietnamese-financial-summarizer

Runtime error

mrstarkng commited on Jun 26

Commit

e466ef8

verified ·

1 Parent(s): abb2932

update cpu app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -19,9 +19,8 @@ tokenizer = AutoTokenizer.from_pretrained(BASE_MODEL_ID)
 # Tải model nền
 base_model = AutoModelForSeq2SeqLM.from_pretrained(
     BASE_MODEL_ID,
-    torch_dtype=torch.bfloat16, # Dùng bfloat16 để tối ưu
-    device_map={"": DEVICE} # Chỉ định rõ thiết bị
-)
 # Tải và áp dụng adapter LoRA từ Hub của bạn
 model = PeftModel.from_pretrained(base_model, ADAPTER_ID)

 # Tải model nền
 base_model = AutoModelForSeq2SeqLM.from_pretrained(
     BASE_MODEL_ID,
+    torch_dtype=torch.float32, # Dùng float32 cho CPU
+).to(DEVICE)
 # Tải và áp dụng adapter LoRA từ Hub của bạn
 model = PeftModel.from_pretrained(base_model, ADAPTER_ID)