End of training

Browse files

Files changed (6) hide show

README.md +41 -41
config.json +2 -2
model.safetensors +2 -2
runs/Mar04_13-53-42_d8c8da50ec4e/events.out.tfevents.1709560423.d8c8da50ec4e.409.1 +3 -0
tokenizer.json +37 -36
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -13,7 +13,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [](https://huggingface.co/) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 1.5023
 ## Model description
@@ -44,46 +44,46 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
-| 3.3775        | 1.0   | 6    | 2.7529          |
-| 2.3702        | 2.0   | 12   | 2.1325          |
-| 1.8843        | 3.0   | 18   | 1.6965          |
-| 1.6497        | 4.0   | 24   | 1.6655          |
-| 1.6067        | 5.0   | 30   | 1.7142          |
-| 1.5987        | 6.0   | 36   | 1.5422          |
-| 1.5515        | 7.0   | 42   | 1.5353          |
-| 1.5423        | 8.0   | 48   | 1.5221          |
-| 1.5279        | 9.0   | 54   | 1.5173          |
-| 1.5394        | 10.0  | 60   | 1.5206          |
-| 1.5298        | 11.0  | 66   | 1.5216          |
-| 1.5003        | 12.0  | 72   | 1.5170          |
-| 1.5462        | 13.0  | 78   | 1.5142          |
-| 1.5107        | 14.0  | 84   | 1.5157          |
-| 1.5059        | 15.0  | 90   | 1.5077          |
-| 1.5442        | 16.0  | 96   | 1.5069          |
-| 1.548         | 17.0  | 102  | 1.5080          |
-| 1.5427        | 18.0  | 108  | 1.5058          |
-| 1.5231        | 19.0  | 114  | 1.5261          |
-| 1.5349        | 20.0  | 120  | 1.5155          |
-| 1.5127        | 21.0  | 126  | 1.5145          |
-| 1.5436        | 22.0  | 132  | 1.5114          |
-| 1.5478        | 23.0  | 138  | 1.5145          |
-| 1.5041        | 24.0  | 144  | 1.5112          |
-| 1.4968        | 25.0  | 150  | 1.5114          |
-| 1.5202        | 26.0  | 156  | 1.5111          |
-| 1.5004        | 27.0  | 162  | 1.5104          |
-| 1.5004        | 28.0  | 168  | 1.5025          |
-| 1.502         | 29.0  | 174  | 1.5034          |
-| 1.5044        | 30.0  | 180  | 1.5057          |
-| 1.5234        | 31.0  | 186  | 1.5072          |
-| 1.5266        | 32.0  | 192  | 1.5074          |
-| 1.5209        | 33.0  | 198  | 1.5071          |
-| 1.502         | 34.0  | 204  | 1.5054          |
-| 1.5408        | 35.0  | 210  | 1.5056          |
-| 1.4966        | 36.0  | 216  | 1.5058          |
-| 1.5492        | 37.0  | 222  | 1.5049          |
-| 1.4984        | 38.0  | 228  | 1.5034          |
-| 1.5358        | 39.0  | 234  | 1.5030          |
-| 1.5127        | 40.0  | 240  | 1.5023          |
 ### Framework versions

 This model is a fine-tuned version of [](https://huggingface.co/) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.2014
 ## Model description
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
+| 2.947         | 1.0   | 6    | 2.2690          |
+| 2.0301        | 2.0   | 12   | 1.7402          |
+| 1.5419        | 3.0   | 18   | 1.2929          |
+| 1.2143        | 4.0   | 24   | 1.0901          |
+| 1.0259        | 5.0   | 30   | 0.9702          |
+| 0.9007        | 6.0   | 36   | 0.8471          |
+| 0.7925        | 7.0   | 42   | 0.8145          |
+| 0.7608        | 8.0   | 48   | 0.7531          |
+| 0.7152        | 9.0   | 54   | 0.6772          |
+| 0.6579        | 10.0  | 60   | 0.6378          |
+| 0.6218        | 11.0  | 66   | 0.5797          |
+| 0.5697        | 12.0  | 72   | 0.5534          |
+| 0.5604        | 13.0  | 78   | 0.5225          |
+| 0.5172        | 14.0  | 84   | 0.4961          |
+| 0.4936        | 15.0  | 90   | 0.4773          |
+| 0.4897        | 16.0  | 96   | 0.5122          |
+| 0.499         | 17.0  | 102  | 0.4710          |
+| 0.4578        | 18.0  | 108  | 0.4763          |
+| 0.4455        | 19.0  | 114  | 0.4437          |
+| 0.4382        | 20.0  | 120  | 0.4259          |
+| 0.407         | 21.0  | 126  | 0.4043          |
+| 0.3937        | 22.0  | 132  | 0.3824          |
+| 0.3753        | 23.0  | 138  | 0.3754          |
+| 0.3795        | 24.0  | 144  | 0.3496          |
+| 0.3553        | 25.0  | 150  | 0.3459          |
+| 0.3454        | 26.0  | 156  | 0.3359          |
+| 0.3391        | 27.0  | 162  | 0.3221          |
+| 0.3182        | 28.0  | 168  | 0.3027          |
+| 0.3087        | 29.0  | 174  | 0.2958          |
+| 0.288         | 30.0  | 180  | 0.2732          |
+| 0.288         | 31.0  | 186  | 0.2607          |
+| 0.2705        | 32.0  | 192  | 0.2444          |
+| 0.2637        | 33.0  | 198  | 0.2393          |
+| 0.2507        | 34.0  | 204  | 0.2264          |
+| 0.2331        | 35.0  | 210  | 0.2193          |
+| 0.2292        | 36.0  | 216  | 0.2118          |
+| 0.2238        | 37.0  | 222  | 0.2089          |
+| 0.2252        | 38.0  | 228  | 0.2051          |
+| 0.2131        | 39.0  | 234  | 0.2043          |
+| 0.2168        | 40.0  | 240  | 0.2014          |
 ### Framework versions

config.json CHANGED Viewed

@@ -78,7 +78,7 @@
     "typical_p": 1.0,
     "use_bfloat16": false,
     "use_cache": true,
-    "vocab_size": 52
   },
   "decoder_start_token_id": 2,
   "encoder": {
@@ -157,7 +157,7 @@
     "typical_p": 1.0,
     "use_bfloat16": false,
     "use_cache": true,
-    "vocab_size": 52
   },
   "eos_token_id": 0,
   "is_encoder_decoder": true,

     "typical_p": 1.0,
     "use_bfloat16": false,
     "use_cache": true,
+    "vocab_size": 53
   },
   "decoder_start_token_id": 2,
   "encoder": {
     "typical_p": 1.0,
     "use_bfloat16": false,
     "use_cache": true,
+    "vocab_size": 53
   },
   "eos_token_id": 0,
   "is_encoder_decoder": true,

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:053134c68c277780219beb08c9c486e66a49b595e60f51b99ef57f737bf26e2f
-size 31205552

 version https://git-lfs.github.com/spec/v1
+oid sha256:f1718e7b86e2847840f6c60a23032d116ce48f66e5c61b46aed03617e0ddab03
+size 31207604

runs/Mar04_13-53-42_d8c8da50ec4e/events.out.tfevents.1709560423.d8c8da50ec4e.409.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a170ff15555aa9829e2ace14a3cccfc58276e1b70d9d46fbfaeb703c8f8c8c4d
+size 27997

tokenizer.json CHANGED Viewed

@@ -112,50 +112,51 @@
       "7": 13,
       "8": 14,
       "9": 15,
-      "99": 16,
       "10": 17,
-      "11": 18,
-      "98": 19,
-      "97": 20,
       "12": 21,
-      "13": 22,
-      "96": 23,
-      "95": 24,
-      "14": 25,
-      "15": 26,
-      "94": 27,
-      "16": 28,
-      "93": 29,
-      "92": 30,
       "17": 31,
-      "18": 32,
-      "91": 33,
-      "19": 34,
-      "90": 35,
-      "20": 36,
-      "89": 37,
-      "21": 38,
       "88": 39,
-      "22": 40,
-      "87": 41,
-      "86": 42,
       "23": 43,
-      "24": 44,
-      "85": 45,
-      "25": 46,
       "84": 47,
-      "26": 48,
-      "83": 49,
-      "27": 50,
-      "82": 51
     },
     "merges": [
-      "9 9",
       "1 0",
       "1 1",
       "9 8",
-      "9 7",
       "1 2",
       "1 3",
       "9 6",
       "9 5",
@@ -164,24 +165,24 @@
       "9 4",
       "1 6",
       "9 3",
-      "9 2",
       "1 7",
       "1 8",
       "9 1",
       "1 9",
       "9 0",
       "2 0",
       "8 9",
-      "2 1",
       "8 8",
       "2 2",
       "8 7",
-      "8 6",
       "2 3",
       "2 4",
       "8 5",
-      "2 5",
       "8 4",
       "2 6",
       "8 3",
       "2 7",

       "7": 13,
       "8": 14,
       "9": 15,
+      "=": 16,
       "10": 17,
+      "99": 18,
+      "11": 19,
+      "98": 20,
       "12": 21,
+      "97": 22,
+      "13": 23,
+      "96": 24,
+      "95": 25,
+      "14": 26,
+      "15": 27,
+      "94": 28,
+      "16": 29,
+      "93": 30,
       "17": 31,
+      "92": 32,
+      "18": 33,
+      "91": 34,
+      "19": 35,
+      "90": 36,
+      "20": 37,
+      "89": 38,
       "88": 39,
+      "21": 40,
+      "22": 41,
+      "87": 42,
       "23": 43,
+      "86": 44,
+      "24": 45,
+      "85": 46,
       "84": 47,
+      "25": 48,
+      "26": 49,
+      "83": 50,
+      "27": 51,
+      "82": 52
     },
     "merges": [
       "1 0",
+      "9 9",
       "1 1",
       "9 8",
       "1 2",
+      "9 7",
       "1 3",
       "9 6",
       "9 5",
       "9 4",
       "1 6",
       "9 3",
       "1 7",
+      "9 2",
       "1 8",
       "9 1",
       "1 9",
       "9 0",
       "2 0",
       "8 9",
       "8 8",
+      "2 1",
       "2 2",
       "8 7",
       "2 3",
+      "8 6",
       "2 4",
       "8 5",
       "8 4",
+      "2 5",
       "2 6",
       "8 3",
       "2 7",

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6de4df87d5fdcfb087440d5eafcae498fa1c8c454f47a2cb6dc311a85eb3b1c0
 size 5112

 version https://git-lfs.github.com/spec/v1
+oid sha256:ac7ad0845eaad54b53a1cc4f9a14b90eecd2370ffb4954a8c0a67c31b5e464ae
 size 5112