ntp0102
/

wav2vec2-base-timit-demo-colab

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 8.96551724137931,
+  "global_step": 1300,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.69,
+      "learning_rate": 9.800000000000001e-06,
+      "loss": 6.7455,
+      "step": 100
+    },
+    {
+      "epoch": 0.69,
+      "eval_loss": 3.444736957550049,
+      "eval_runtime": 160.2395,
+      "eval_samples_per_second": 10.484,
+      "eval_steps_per_second": 1.311,
+      "eval_wer": 1.0,
+      "step": 100
+    },
+    {
+      "epoch": 1.38,
+      "learning_rate": 1.9800000000000004e-05,
+      "loss": 3.0918,
+      "step": 200
+    },
+    {
+      "epoch": 1.38,
+      "eval_loss": 3.1145176887512207,
+      "eval_runtime": 158.2985,
+      "eval_samples_per_second": 10.613,
+      "eval_steps_per_second": 1.327,
+      "eval_wer": 1.0,
+      "step": 200
+    },
+    {
+      "epoch": 2.07,
+      "learning_rate": 2.98e-05,
+      "loss": 2.993,
+      "step": 300
+    },
+    {
+      "epoch": 2.07,
+      "eval_loss": 3.019571542739868,
+      "eval_runtime": 158.8309,
+      "eval_samples_per_second": 10.577,
+      "eval_steps_per_second": 1.322,
+      "eval_wer": 1.0,
+      "step": 300
+    },
+    {
+      "epoch": 2.76,
+      "learning_rate": 3.9800000000000005e-05,
+      "loss": 2.8437,
+      "step": 400
+    },
+    {
+      "epoch": 2.76,
+      "eval_loss": 2.65022873878479,
+      "eval_runtime": 160.2969,
+      "eval_samples_per_second": 10.481,
+      "eval_steps_per_second": 1.31,
+      "eval_wer": 1.0,
+      "step": 400
+    },
+    {
+      "epoch": 3.45,
+      "learning_rate": 4.9800000000000004e-05,
+      "loss": 1.8412,
+      "step": 500
+    },
+    {
+      "epoch": 3.45,
+      "eval_loss": 1.2323112487792969,
+      "eval_runtime": 158.1276,
+      "eval_samples_per_second": 10.624,
+      "eval_steps_per_second": 1.328,
+      "eval_wer": 0.7826476466129143,
+      "step": 500
+    },
+    {
+      "epoch": 4.14,
+      "learning_rate": 5.9800000000000003e-05,
+      "loss": 0.9075,
+      "step": 600
+    },
+    {
+      "epoch": 4.14,
+      "eval_loss": 0.7735909819602966,
+      "eval_runtime": 158.7654,
+      "eval_samples_per_second": 10.582,
+      "eval_steps_per_second": 1.323,
+      "eval_wer": 0.5620563710288746,
+      "step": 600
+    },
+    {
+      "epoch": 4.83,
+      "learning_rate": 6.98e-05,
+      "loss": 0.636,
+      "step": 700
+    },
+    {
+      "epoch": 4.83,
+      "eval_loss": 0.5790171027183533,
+      "eval_runtime": 157.8314,
+      "eval_samples_per_second": 10.644,
+      "eval_steps_per_second": 1.331,
+      "eval_wer": 0.4735028598993867,
+      "step": 700
+    },
+    {
+      "epoch": 5.52,
+      "learning_rate": 7.98e-05,
+      "loss": 0.4722,
+      "step": 800
+    },
+    {
+      "epoch": 5.52,
+      "eval_loss": 0.4459346830844879,
+      "eval_runtime": 157.8463,
+      "eval_samples_per_second": 10.643,
+      "eval_steps_per_second": 1.33,
+      "eval_wer": 0.4053476672868858,
+      "step": 800
+    },
+    {
+      "epoch": 6.21,
+      "learning_rate": 8.98e-05,
+      "loss": 0.3731,
+      "step": 900
+    },
+    {
+      "epoch": 6.21,
+      "eval_loss": 0.4491881728172302,
+      "eval_runtime": 159.6087,
+      "eval_samples_per_second": 10.526,
+      "eval_steps_per_second": 1.316,
+      "eval_wer": 0.3866721797257253,
+      "step": 900
+    },
+    {
+      "epoch": 6.9,
+      "learning_rate": 9.970000000000001e-05,
+      "loss": 0.3311,
+      "step": 1000
+    },
+    {
+      "epoch": 6.9,
+      "eval_loss": 0.45955753326416016,
+      "eval_runtime": 159.4424,
+      "eval_samples_per_second": 10.537,
+      "eval_steps_per_second": 1.317,
+      "eval_wer": 0.3837089104817035,
+      "step": 1000
+    },
+    {
+      "epoch": 7.59,
+      "learning_rate": 9.71044776119403e-05,
+      "loss": 0.2837,
+      "step": 1100
+    },
+    {
+      "epoch": 7.59,
+      "eval_loss": 0.4186123013496399,
+      "eval_runtime": 159.4455,
+      "eval_samples_per_second": 10.537,
+      "eval_steps_per_second": 1.317,
+      "eval_wer": 0.3769554131348632,
+      "step": 1100
+    },
+    {
+      "epoch": 8.28,
+      "learning_rate": 9.411940298507463e-05,
+      "loss": 0.2376,
+      "step": 1200
+    },
+    {
+      "epoch": 8.28,
+      "eval_loss": 0.38879477977752686,
+      "eval_runtime": 161.7544,
+      "eval_samples_per_second": 10.386,
+      "eval_steps_per_second": 1.298,
+      "eval_wer": 0.35703948728550755,
+      "step": 1200
+    },
+    {
+      "epoch": 8.97,
+      "learning_rate": 9.113432835820896e-05,
+      "loss": 0.2021,
+      "step": 1300
+    },
+    {
+      "epoch": 8.97,
+      "eval_loss": 0.3911074101924896,
+      "eval_runtime": 160.3132,
+      "eval_samples_per_second": 10.479,
+      "eval_steps_per_second": 1.31,
+      "eval_wer": 0.35373165185032046,
+      "step": 1300
+    }
+  ],
+  "max_steps": 4350,
+  "num_train_epochs": 30,
+  "total_flos": 1.1933390477768602e+18,
+  "trial_name": null,
+  "trial_params": null
+}