Spaces:

UcsTurkey
/

fine-tune-inference-test

Paused

ciyidogan commited on May 14

Commit

d2b7005

verified ·

1 Parent(s): 4a97af8

Update fine_tune_inference_test.py

Files changed (1) hide show

fine_tune_inference_test.py CHANGED Viewed

@@ -167,19 +167,25 @@ def setup_model():
         log("🔁 Tokenizer yükleniyor...")
         tokenizer = AutoTokenizer.from_pretrained(os.path.join(extract_dir, "output"))
         log("🧠 Base model indiriliyor...")
         base_model = AutoModelForCausalLM.from_pretrained(
             MODEL_BASE,
-            torch_dtype=torch.float16 if torch.cuda.is_available() else torch.float32
-        )
         log("➕ LoRA adapter uygulanıyor...")
-        peft_model = PeftModel.from_pretrained(base_model, os.path.join(extract_dir, "output"))
-        model = peft_model.model
         model.eval()
-        log("✅ Model başarıyla yüklendi.")
     except Exception as e:
         log(f"❌ setup_model() sırasında hata oluştu: {e}")

         log("🔁 Tokenizer yükleniyor...")
         tokenizer = AutoTokenizer.from_pretrained(os.path.join(extract_dir, "output"))
+        if tokenizer.pad_token is None:
+            tokenizer.pad_token = tokenizer.eos_token
         log("🧠 Base model indiriliyor...")
         base_model = AutoModelForCausalLM.from_pretrained(
             MODEL_BASE,
+            torch_dtype=torch.bfloat16 if torch.cuda.is_available() else torch.float32
+        ).to("cuda" if torch.cuda.is_available() else "cpu")
         log("➕ LoRA adapter uygulanıyor...")
+        peft_model = PeftModel.from_pretrained(
+            base_model,
+            os.path.join(extract_dir, "output")
+        )
+        model = peft_model.model.to("cuda" if torch.cuda.is_available() else "cpu")
         model.eval()
+        log(f"✅ Model başarıyla yüklendi. dtype={next(model.parameters()).dtype}, device={next(model.parameters()).device}")
     except Exception as e:
         log(f"❌ setup_model() sırasında hata oluştu: {e}")