first commit

Files changed (9) hide show

config.json +86 -0
optimizer.pt +3 -0
preprocessor_config.json +9 -0
pytorch_model.bin +3 -0
rng_state.pth +3 -0
scaler.pt +3 -0
scheduler.pt +3 -0
trainer_state.json +496 -0
training_args.bin +3 -0

config.json ADDED Viewed

	@@ -0,0 +1,86 @@

+{
+  "_name_or_path": "facebook/wav2vec2-base",
+  "activation_dropout": 0.0,
+  "apply_spec_augment": true,
+  "architectures": [
+    "Wav2Vec2ForCTC"
+  ],
+  "attention_dropout": 0.1,
+  "bos_token_id": 1,
+  "codevector_dim": 256,
+  "contrastive_logits_temperature": 0.1,
+  "conv_bias": false,
+  "conv_dim": [
+    512,
+    512,
+    512,
+    512,
+    512,
+    512,
+    512
+  ],
+  "conv_kernel": [
+    10,
+    3,
+    3,
+    3,
+    3,
+    2,
+    2
+  ],
+  "conv_stride": [
+    5,
+    2,
+    2,
+    2,
+    2,
+    2,
+    2
+  ],
+  "ctc_loss_reduction": "mean",
+  "ctc_zero_infinity": false,
+  "diversity_loss_weight": 0.1,
+  "do_stable_layer_norm": false,
+  "eos_token_id": 2,
+  "feat_extract_activation": "gelu",
+  "feat_extract_norm": "group",
+  "feat_proj_dropout": 0.1,
+  "feat_quantizer_dropout": 0.0,
+  "final_dropout": 0.0,
+  "freeze_feat_extract_train": true,
+  "gradient_checkpointing": true,
+  "hidden_act": "gelu",
+  "hidden_dropout": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-05,
+  "layerdrop": 0.05,
+  "mask_channel_length": 10,
+  "mask_channel_min_space": 1,
+  "mask_channel_other": 0.0,
+  "mask_channel_prob": 0.0,
+  "mask_channel_selection": "static",
+  "mask_feature_length": 10,
+  "mask_feature_prob": 0.0,
+  "mask_time_length": 10,
+  "mask_time_min_space": 1,
+  "mask_time_other": 0.0,
+  "mask_time_prob": 0.05,
+  "mask_time_selection": "static",
+  "model_type": "wav2vec2",
+  "no_mask_channel_overlap": false,
+  "no_mask_time_overlap": false,
+  "num_attention_heads": 12,
+  "num_codevector_groups": 2,
+  "num_codevectors_per_group": 320,
+  "num_conv_pos_embedding_groups": 16,
+  "num_conv_pos_embeddings": 128,
+  "num_feat_extract_layers": 7,
+  "num_hidden_layers": 12,
+  "num_negatives": 100,
+  "pad_token_id": 29,
+  "proj_codevector_dim": 256,
+  "transformers_version": "4.8.2",
+  "vocab_size": 32
+}

optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:98fde8e74d7a8b2b7dc5f15703537251d5609c0ac4e0e4dee376a2d8961afde4
+size 721685265

preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "do_normalize": true,
+  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
+  "feature_size": 1,
+  "padding_side": "right",
+  "padding_value": 0.0,
+  "return_attention_mask": false,
+  "sampling_rate": 16000
+}

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3386ee4cecd97af2b1d2a197bcc8c4609f8a2acc4839229264bce3e58e4e948a
+size 377670039

rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:431d1733cb5e5c7b76a527aac0a7a9cd041d1b0b07239c1ccc6cf97c77a085aa
+size 17563

scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:855e90b86493eac22e9016356f64ba6930858b1ed321024ff004ddf9cce9c4a5
+size 559

scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2dfd2e36c120141d95b66394d25c45930f4c27eb388087627bc3ec813348ab7a
+size 623

trainer_state.json ADDED Viewed

	@@ -0,0 +1,496 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 29.906542056074766,
+  "global_step": 3200,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.93,
+      "learning_rate": 9.7e-06,
+      "loss": 9.9876,
+      "step": 100
+    },
+    {
+      "epoch": 0.93,
+      "eval_loss": 4.772322177886963,
+      "eval_runtime": 43.7501,
+      "eval_samples_per_second": 19.497,
+      "eval_steps_per_second": 0.617,
+      "eval_wer": 1.0,
+      "step": 100
+    },
+    {
+      "epoch": 1.87,
+      "learning_rate": 1.97e-05,
+      "loss": 3.6526,
+      "step": 200
+    },
+    {
+      "epoch": 1.87,
+      "eval_loss": 3.8356621265411377,
+      "eval_runtime": 43.2583,
+      "eval_samples_per_second": 19.719,
+      "eval_steps_per_second": 0.624,
+      "eval_wer": 1.0,
+      "step": 200
+    },
+    {
+      "epoch": 2.8,
+      "learning_rate": 2.96e-05,
+      "loss": 3.1832,
+      "step": 300
+    },
+    {
+      "epoch": 2.8,
+      "eval_loss": 3.42309832572937,
+      "eval_runtime": 43.8662,
+      "eval_samples_per_second": 19.446,
+      "eval_steps_per_second": 0.616,
+      "eval_wer": 1.0,
+      "step": 300
+    },
+    {
+      "epoch": 3.74,
+      "learning_rate": 3.960000000000001e-05,
+      "loss": 3.0394,
+      "step": 400
+    },
+    {
+      "epoch": 3.74,
+      "eval_loss": 3.35982608795166,
+      "eval_runtime": 43.5204,
+      "eval_samples_per_second": 19.6,
+      "eval_steps_per_second": 0.62,
+      "eval_wer": 1.0,
+      "step": 400
+    },
+    {
+      "epoch": 4.67,
+      "learning_rate": 4.96e-05,
+      "loss": 2.9964,
+      "step": 500
+    },
+    {
+      "epoch": 4.67,
+      "eval_loss": 3.0924816131591797,
+      "eval_runtime": 42.6866,
+      "eval_samples_per_second": 19.983,
+      "eval_steps_per_second": 0.633,
+      "eval_wer": 1.0,
+      "step": 500
+    },
+    {
+      "epoch": 5.61,
+      "learning_rate": 5.96e-05,
+      "loss": 2.9881,
+      "step": 600
+    },
+    {
+      "epoch": 5.61,
+      "eval_loss": 3.0199828147888184,
+      "eval_runtime": 44.2234,
+      "eval_samples_per_second": 19.288,
+      "eval_steps_per_second": 0.611,
+      "eval_wer": 1.0,
+      "step": 600
+    },
+    {
+      "epoch": 6.54,
+      "learning_rate": 6.96e-05,
+      "loss": 2.9678,
+      "step": 700
+    },
+    {
+      "epoch": 6.54,
+      "eval_loss": 3.0672409534454346,
+      "eval_runtime": 44.282,
+      "eval_samples_per_second": 19.263,
+      "eval_steps_per_second": 0.61,
+      "eval_wer": 1.0,
+      "step": 700
+    },
+    {
+      "epoch": 7.48,
+      "learning_rate": 7.960000000000001e-05,
+      "loss": 2.7541,
+      "step": 800
+    },
+    {
+      "epoch": 7.48,
+      "eval_loss": 2.397754669189453,
+      "eval_runtime": 43.7165,
+      "eval_samples_per_second": 19.512,
+      "eval_steps_per_second": 0.618,
+      "eval_wer": 0.9788053949903661,
+      "step": 800
+    },
+    {
+      "epoch": 8.41,
+      "learning_rate": 8.960000000000001e-05,
+      "loss": 1.876,
+      "step": 900
+    },
+    {
+      "epoch": 8.41,
+      "eval_loss": 1.5307629108428955,
+      "eval_runtime": 43.4064,
+      "eval_samples_per_second": 19.651,
+      "eval_steps_per_second": 0.622,
+      "eval_wer": 0.7509098694069792,
+      "step": 900
+    },
+    {
+      "epoch": 9.35,
+      "learning_rate": 9.960000000000001e-05,
+      "loss": 1.4334,
+      "step": 1000
+    },
+    {
+      "epoch": 9.35,
+      "eval_loss": 1.435613751411438,
+      "eval_runtime": 43.9507,
+      "eval_samples_per_second": 19.408,
+      "eval_steps_per_second": 0.614,
+      "eval_wer": 0.620316848640548,
+      "step": 1000
+    },
+    {
+      "epoch": 10.28,
+      "learning_rate": 9.565610859728508e-05,
+      "loss": 1.223,
+      "step": 1100
+    },
+    {
+      "epoch": 10.28,
+      "eval_loss": 1.0539987087249756,
+      "eval_runtime": 43.8182,
+      "eval_samples_per_second": 19.467,
+      "eval_steps_per_second": 0.616,
+      "eval_wer": 0.5885249411260972,
+      "step": 1100
+    },
+    {
+      "epoch": 11.21,
+      "learning_rate": 9.113122171945702e-05,
+      "loss": 1.0139,
+      "step": 1200
+    },
+    {
+      "epoch": 11.21,
+      "eval_loss": 0.9824701547622681,
+      "eval_runtime": 43.7265,
+      "eval_samples_per_second": 19.508,
+      "eval_steps_per_second": 0.617,
+      "eval_wer": 0.4964675658317277,
+      "step": 1200
+    },
+    {
+      "epoch": 12.15,
+      "learning_rate": 8.660633484162897e-05,
+      "loss": 0.9349,
+      "step": 1300
+    },
+    {
+      "epoch": 12.15,
+      "eval_loss": 0.981073796749115,
+      "eval_runtime": 43.357,
+      "eval_samples_per_second": 19.674,
+      "eval_steps_per_second": 0.623,
+      "eval_wer": 0.4774138300149861,
+      "step": 1300
+    },
+    {
+      "epoch": 13.08,
+      "learning_rate": 8.20814479638009e-05,
+      "loss": 0.8395,
+      "step": 1400
+    },
+    {
+      "epoch": 13.08,
+      "eval_loss": 0.9597522616386414,
+      "eval_runtime": 44.326,
+      "eval_samples_per_second": 19.244,
+      "eval_steps_per_second": 0.609,
+      "eval_wer": 0.44166131449368445,
+      "step": 1400
+    },
+    {
+      "epoch": 14.02,
+      "learning_rate": 7.755656108597285e-05,
+      "loss": 0.8417,
+      "step": 1500
+    },
+    {
+      "epoch": 14.02,
+      "eval_loss": 0.9240782856941223,
+      "eval_runtime": 44.9894,
+      "eval_samples_per_second": 18.96,
+      "eval_steps_per_second": 0.6,
+      "eval_wer": 0.43513166345536286,
+      "step": 1500
+    },
+    {
+      "epoch": 14.95,
+      "learning_rate": 7.30316742081448e-05,
+      "loss": 0.7091,
+      "step": 1600
+    },
+    {
+      "epoch": 14.95,
+      "eval_loss": 0.9342209100723267,
+      "eval_runtime": 43.4211,
+      "eval_samples_per_second": 19.645,
+      "eval_steps_per_second": 0.622,
+      "eval_wer": 0.4319203596660244,
+      "step": 1600
+    },
+    {
+      "epoch": 15.89,
+      "learning_rate": 6.850678733031674e-05,
+      "loss": 0.6622,
+      "step": 1700
+    },
+    {
+      "epoch": 15.89,
+      "eval_loss": 0.895724892616272,
+      "eval_runtime": 43.4542,
+      "eval_samples_per_second": 19.63,
+      "eval_steps_per_second": 0.621,
+      "eval_wer": 0.41629201455791054,
+      "step": 1700
+    },
+    {
+      "epoch": 16.82,
+      "learning_rate": 6.398190045248869e-05,
+      "loss": 0.6762,
+      "step": 1800
+    },
+    {
+      "epoch": 16.82,
+      "eval_loss": 0.9993765354156494,
+      "eval_runtime": 44.1607,
+      "eval_samples_per_second": 19.316,
+      "eval_steps_per_second": 0.611,
+      "eval_wer": 0.40023549561121813,
+      "step": 1800
+    },
+    {
+      "epoch": 17.76,
+      "learning_rate": 5.945701357466064e-05,
+      "loss": 0.6325,
+      "step": 1900
+    },
+    {
+      "epoch": 17.76,
+      "eval_loss": 0.9341434240341187,
+      "eval_runtime": 42.9623,
+      "eval_samples_per_second": 19.855,
+      "eval_steps_per_second": 0.628,
+      "eval_wer": 0.41168914579319205,
+      "step": 1900
+    },
+    {
+      "epoch": 18.69,
+      "learning_rate": 5.4932126696832586e-05,
+      "loss": 0.5829,
+      "step": 2000
+    },
+    {
+      "epoch": 18.69,
+      "eval_loss": 1.0207712650299072,
+      "eval_runtime": 42.8374,
+      "eval_samples_per_second": 19.913,
+      "eval_steps_per_second": 0.63,
+      "eval_wer": 0.3980946264183258,
+      "step": 2000
+    },
+    {
+      "epoch": 19.63,
+      "learning_rate": 5.0407239819004526e-05,
+      "loss": 0.5598,
+      "step": 2100
+    },
+    {
+      "epoch": 19.63,
+      "eval_loss": 1.0339125394821167,
+      "eval_runtime": 42.5183,
+      "eval_samples_per_second": 20.062,
+      "eval_steps_per_second": 0.635,
+      "eval_wer": 0.39359880111325196,
+      "step": 2100
+    },
+    {
+      "epoch": 20.56,
+      "learning_rate": 4.588235294117647e-05,
+      "loss": 0.5637,
+      "step": 2200
+    },
+    {
+      "epoch": 20.56,
+      "eval_loss": 0.9660681486129761,
+      "eval_runtime": 44.6662,
+      "eval_samples_per_second": 19.097,
+      "eval_steps_per_second": 0.604,
+      "eval_wer": 0.399165061014772,
+      "step": 2200
+    },
+    {
+      "epoch": 21.5,
+      "learning_rate": 4.1357466063348414e-05,
+      "loss": 0.5396,
+      "step": 2300
+    },
+    {
+      "epoch": 21.5,
+      "eval_loss": 1.05593740940094,
+      "eval_runtime": 44.132,
+      "eval_samples_per_second": 19.328,
+      "eval_steps_per_second": 0.612,
+      "eval_wer": 0.3923142795975166,
+      "step": 2300
+    },
+    {
+      "epoch": 22.43,
+      "learning_rate": 3.683257918552037e-05,
+      "loss": 0.5001,
+      "step": 2400
+    },
+    {
+      "epoch": 22.43,
+      "eval_loss": 0.9710575938224792,
+      "eval_runtime": 43.7084,
+      "eval_samples_per_second": 19.516,
+      "eval_steps_per_second": 0.618,
+      "eval_wer": 0.38589167201883967,
+      "step": 2400
+    },
+    {
+      "epoch": 23.36,
+      "learning_rate": 3.230769230769231e-05,
+      "loss": 0.4797,
+      "step": 2500
+    },
+    {
+      "epoch": 23.36,
+      "eval_loss": 0.9755498766899109,
+      "eval_runtime": 43.0821,
+      "eval_samples_per_second": 19.799,
+      "eval_steps_per_second": 0.627,
+      "eval_wer": 0.3775422821665596,
+      "step": 2500
+    },
+    {
+      "epoch": 24.3,
+      "learning_rate": 2.7782805429864255e-05,
+      "loss": 0.4993,
+      "step": 2600
+    },
+    {
+      "epoch": 24.3,
+      "eval_loss": 0.9937364459037781,
+      "eval_runtime": 43.0983,
+      "eval_samples_per_second": 19.792,
+      "eval_steps_per_second": 0.626,
+      "eval_wer": 0.37315350032113037,
+      "step": 2600
+    },
+    {
+      "epoch": 25.23,
+      "learning_rate": 2.3257918552036202e-05,
+      "loss": 0.4728,
+      "step": 2700
+    },
+    {
+      "epoch": 25.23,
+      "eval_loss": 1.028990387916565,
+      "eval_runtime": 44.5142,
+      "eval_samples_per_second": 19.162,
+      "eval_steps_per_second": 0.607,
+      "eval_wer": 0.37229715264397345,
+      "step": 2700
+    },
+    {
+      "epoch": 26.17,
+      "learning_rate": 1.8733031674208146e-05,
+      "loss": 0.4479,
+      "step": 2800
+    },
+    {
+      "epoch": 26.17,
+      "eval_loss": 0.9995871186256409,
+      "eval_runtime": 43.2227,
+      "eval_samples_per_second": 19.735,
+      "eval_steps_per_second": 0.625,
+      "eval_wer": 0.36897880539499034,
+      "step": 2800
+    },
+    {
+      "epoch": 27.1,
+      "learning_rate": 1.4208144796380091e-05,
+      "loss": 0.4675,
+      "step": 2900
+    },
+    {
+      "epoch": 27.1,
+      "eval_loss": 1.0029648542404175,
+      "eval_runtime": 42.9456,
+      "eval_samples_per_second": 19.862,
+      "eval_steps_per_second": 0.629,
+      "eval_wer": 0.37101263112823807,
+      "step": 2900
+    },
+    {
+      "epoch": 28.04,
+      "learning_rate": 9.683257918552037e-06,
+      "loss": 0.4454,
+      "step": 3000
+    },
+    {
+      "epoch": 28.04,
+      "eval_loss": 1.0169341564178467,
+      "eval_runtime": 43.9547,
+      "eval_samples_per_second": 19.406,
+      "eval_steps_per_second": 0.614,
+      "eval_wer": 0.37037037037037035,
+      "step": 3000
+    },
+    {
+      "epoch": 28.97,
+      "learning_rate": 5.1583710407239815e-06,
+      "loss": 0.4473,
+      "step": 3100
+    },
+    {
+      "epoch": 28.97,
+      "eval_loss": 1.0175889730453491,
+      "eval_runtime": 43.8487,
+      "eval_samples_per_second": 19.453,
+      "eval_steps_per_second": 0.616,
+      "eval_wer": 0.3707985442089488,
+      "step": 3100
+    },
+    {
+      "epoch": 29.91,
+      "learning_rate": 6.334841628959276e-07,
+      "loss": 0.4005,
+      "step": 3200
+    },
+    {
+      "epoch": 29.91,
+      "eval_loss": 1.0105210542678833,
+      "eval_runtime": 42.6213,
+      "eval_samples_per_second": 20.013,
+      "eval_steps_per_second": 0.633,
+      "eval_wer": 0.36951402269321343,
+      "step": 3200
+    }
+  ],
+  "max_steps": 3210,
+  "num_train_epochs": 30,
+  "total_flos": 4.853367218401499e+18,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1cc93a3edab83807f4e8aa596b6a8205774da23b84143b518db4caa278252946
+size 2671