Spaces:

UcsTurkey
/

mistral7b

Paused

ciyidogan commited on May 20

Commit

17584c6

verified ·

1 Parent(s): 01fdd15

Update train_lora_mistral.py

Files changed (1) hide show

train_lora_mistral.py CHANGED Viewed

@@ -36,6 +36,7 @@ def run_health_server():
 threading.Thread(target=run_health_server, daemon=True).start()
 # === Log
 def log(message):
     timestamp = datetime.now().strftime("%H:%M:%S")
     print(f"[{timestamp}] {message}")
@@ -43,7 +44,7 @@ def log(message):
 # === Eğitim Başlıyor
 log("🛠️ Ortam hazırlanıyor...")
-tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
 if tokenizer.pad_token is None:
     tokenizer.pad_token = tokenizer.eos_token
@@ -95,6 +96,11 @@ for file in selected_files:
         log(f"🔍 {len(dataset)} örnek")
         if len(dataset) == 0:
             continue
         trainer = Trainer(model=model, args=training_args, train_dataset=dataset)
         log("🚀 Eğitim başlıyor...")
         trainer.train()

 threading.Thread(target=run_health_server, daemon=True).start()
 # === Log
 def log(message):
     timestamp = datetime.now().strftime("%H:%M:%S")
     print(f"[{timestamp}] {message}")
 # === Eğitim Başlıyor
 log("🛠️ Ortam hazırlanıyor...")
+tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME, use_fast=False)
 if tokenizer.pad_token is None:
     tokenizer.pad_token = tokenizer.eos_token
         log(f"🔍 {len(dataset)} örnek")
         if len(dataset) == 0:
             continue
+        # Eğitim öncesi örnek prompt kontrolü
+        first_row = dataset[0]
+        log(f"📌 Örnek prompt: {tokenizer.decode(first_row['input_ids'], skip_special_tokens=True)}")
         trainer = Trainer(model=model, args=training_args, train_dataset=dataset)
         log("🚀 Eğitim başlıyor...")
         trainer.train()