LIFineTuned

Paused

alexkueck commited on Aug 14, 2023

Commit

ee00be9

1 Parent(s): eb5d4e5

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -198,7 +198,7 @@ lm_datasets = tokenized_datasets.map(
 # Batches von Daten zusammenfassen
 tokenizer.pad_token = tokenizer.eos_token
-data_collator = DataCollatorForLanguageModeling(tokenizer, mlm=False)
 print ("###############lm datasets####################")
@@ -264,8 +264,8 @@ trainer = Trainer(
         args=training_args,
         train_dataset=lm_datasets["train"],
         eval_dataset=lm_datasets["test"],
-        data_collator=data_collator,
-        #tokenizer=tokenizer,
         compute_metrics=compute_metrics,
 )

 # Batches von Daten zusammenfassen
 tokenizer.pad_token = tokenizer.eos_token
+#data_collator = DataCollatorForLanguageModeling(tokenizer, mlm=False)
 print ("###############lm datasets####################")
         args=training_args,
         train_dataset=lm_datasets["train"],
         eval_dataset=lm_datasets["test"],
+        #data_collator=data_collator,
+        tokenizer=tokenizer,
         compute_metrics=compute_metrics,
 )