Spaces:

tahirsher
/

ASR_Model_for_Transcription_into_Text

Sleeping

tahirsher commited on Mar 9

Commit

859561d

verified ·

1 Parent(s): 8dd61a6

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -10,7 +10,7 @@ from transformers import (
     AutoModelForSpeechSeq2Seq,
     TrainingArguments,
     Trainer,
-    DataCollatorForSeq2Seq,
 )
 # ================================
@@ -116,16 +116,15 @@ training_args = TrainingArguments(
     hub_token=HF_TOKEN,
 )
-# Data collator (for dynamic padding)
-data_collator = DataCollatorForSeq2Seq(processor, model=model)
-# Define Trainer (Fixed `processing_class` warning)
 trainer = Trainer(
     model=model,
     args=training_args,
     train_dataset=train_dataset,
     eval_dataset=eval_dataset,
-    processing_class=processor,  # Fix: Replacing deprecated `tokenizer`
     data_collator=data_collator,
 )

     AutoModelForSpeechSeq2Seq,
     TrainingArguments,
     Trainer,
+    DataCollatorSpeechSeq2Seq,  # ✅ Fix: Use correct data collator
 )
 # ================================
     hub_token=HF_TOKEN,
 )
+# ✅ FIX: Use correct Data Collator
+data_collator = DataCollatorSpeechSeq2Seq(processor=processor, model=model, return_tensors="pt")
+# Define Trainer
 trainer = Trainer(
     model=model,
     args=training_args,
     train_dataset=train_dataset,
     eval_dataset=eval_dataset,
     data_collator=data_collator,
 )