Spaces:

Emmiq
/

EmmiSpace

Build error

Zhikang Niu Yushen CHEN commited on Mar 28

Commit

7192794

1 Parent(s): 8109c57

update: better save last & per ckpt logic #924

Co-authored-by: Yushen CHEN <[email protected]>

Files changed (1) hide show

src/f5_tts/model/trainer.py CHANGED Viewed

@@ -395,6 +395,9 @@ class Trainer:
                         self.writer.add_scalar("loss", loss.item(), global_update)
                         self.writer.add_scalar("lr", self.scheduler.get_last_lr()[0], global_update)
                 if global_update % self.save_per_updates == 0 and self.accelerator.sync_gradients:
                     self.save_checkpoint(global_update)
@@ -430,9 +433,6 @@ class Trainer:
                         )
                         self.model.train()
-                if global_update % self.last_per_updates == 0 and self.accelerator.sync_gradients:
-                    self.save_checkpoint(global_update, last=True)
         self.save_checkpoint(global_update, last=True)
         self.accelerator.end_training()

                         self.writer.add_scalar("loss", loss.item(), global_update)
                         self.writer.add_scalar("lr", self.scheduler.get_last_lr()[0], global_update)
+                if global_update % self.last_per_updates == 0 and self.accelerator.sync_gradients:
+                    self.save_checkpoint(global_update, last=True)
                 if global_update % self.save_per_updates == 0 and self.accelerator.sync_gradients:
                     self.save_checkpoint(global_update)
                         )
                         self.model.train()
         self.save_checkpoint(global_update, last=True)
         self.accelerator.end_training()