Update tokenize_and_upload_mistral.py
Browse files
tokenize_and_upload_mistral.py
CHANGED
@@ -49,7 +49,7 @@ def log(message):
|
|
49 |
# === Tokenizer ===
|
50 |
os.environ["HF_HOME"] = CACHE_DIR
|
51 |
log(f"🔁 Tokenizer yükleniyor: {MODEL_NAME}")
|
52 |
-
tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME, use_fast=
|
53 |
if tokenizer.pad_token is None:
|
54 |
log("ℹ️ pad_token tanımlı değil, eos_token atanıyor.")
|
55 |
tokenizer.pad_token = tokenizer.eos_token
|
|
|
49 |
# === Tokenizer ===
|
50 |
os.environ["HF_HOME"] = CACHE_DIR
|
51 |
log(f"🔁 Tokenizer yükleniyor: {MODEL_NAME}")
|
52 |
+
tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME, use_fast=False, cache_dir=CACHE_DIR)
|
53 |
if tokenizer.pad_token is None:
|
54 |
log("ℹ️ pad_token tanımlı değil, eos_token atanıyor.")
|
55 |
tokenizer.pad_token = tokenizer.eos_token
|