Run 3. Outer Step 12. Inner Step 0.

Files changed (3) hide show

config.json CHANGED Viewed

@@ -154,13 +154,13 @@
     "232": "NON_PARTICIPATING",
     "233": "NON_PARTICIPATING",
     "234": "NON_PARTICIPATING",
-    "235": "SUCCESS",
     "236": "NON_PARTICIPATING",
     "237": "NON_PARTICIPATING",
     "238": "NON_PARTICIPATING",
     "239": "NON_PARTICIPATING",
     "24": "NON_PARTICIPATING",
-    "240": "SUCCESS",
     "241": "NON_PARTICIPATING",
     "242": "NON_PARTICIPATING",
     "243": "NON_PARTICIPATING",
@@ -170,7 +170,7 @@
     "247": "NON_PARTICIPATING",
     "248": "NON_PARTICIPATING",
     "249": "NON_PARTICIPATING",
-    "25": "SUCCESS",
     "250": "NON_PARTICIPATING",
     "251": "NON_PARTICIPATING",
     "252": "NON_PARTICIPATING",
@@ -212,7 +212,7 @@
     "55": "NON_PARTICIPATING",
     "56": "NON_PARTICIPATING",
     "57": "NON_PARTICIPATING",
-    "58": "SUCCESS",
     "59": "NON_PARTICIPATING",
     "6": "NON_PARTICIPATING",
     "60": "NON_PARTICIPATING",
@@ -268,25 +268,20 @@
     "AutoModelForCausalLM": "distributed/optimized-gpt2-500m--modeling_gpt_optimized.GPTOptim"
   },
   "block_list": [
-    5149423,
-    5149427,
-    5149431,
-    5149435,
-    5149439,
-    5149443,
-    5149447,
-    5149451,
-    5149455,
-    5149459
   ],
   "block_size": 1024,
   "bos_token_id": 50256,
   "embd_pdrop": 0.1,
   "eos_token_id": 50256,
   "initializer_range": 0.02,
-  "inner_step": 62,
   "inner_steps": 0,
-  "last_allreduce_block": 5148895,
   "layer_norm_epsilon": 1e-05,
   "model_type": "gpt_optimized",
   "n_embd": 1280,

     "232": "NON_PARTICIPATING",
     "233": "NON_PARTICIPATING",
     "234": "NON_PARTICIPATING",
+    "235": "NON_PARTICIPATING",
     "236": "NON_PARTICIPATING",
     "237": "NON_PARTICIPATING",
     "238": "NON_PARTICIPATING",
     "239": "NON_PARTICIPATING",
     "24": "NON_PARTICIPATING",
+    "240": "NON_PARTICIPATING",
     "241": "NON_PARTICIPATING",
     "242": "NON_PARTICIPATING",
     "243": "NON_PARTICIPATING",
     "247": "NON_PARTICIPATING",
     "248": "NON_PARTICIPATING",
     "249": "NON_PARTICIPATING",
+    "25": "NON_PARTICIPATING",
     "250": "NON_PARTICIPATING",
     "251": "NON_PARTICIPATING",
     "252": "NON_PARTICIPATING",
     "55": "NON_PARTICIPATING",
     "56": "NON_PARTICIPATING",
     "57": "NON_PARTICIPATING",
+    "58": "NON_PARTICIPATING",
     "59": "NON_PARTICIPATING",
     "6": "NON_PARTICIPATING",
     "60": "NON_PARTICIPATING",
     "AutoModelForCausalLM": "distributed/optimized-gpt2-500m--modeling_gpt_optimized.GPTOptim"
   },
   "block_list": [
+    5459667,
+    5459671,
+    5459676,
+    5459680,
+    5459684
   ],
   "block_size": 1024,
   "bos_token_id": 50256,
   "embd_pdrop": 0.1,
   "eos_token_id": 50256,
   "initializer_range": 0.02,
+  "inner_step": 0,
   "inner_steps": 0,
+  "last_allreduce_block": 5450451,
   "layer_norm_epsilon": 1e-05,
   "model_type": "gpt_optimized",
   "n_embd": 1280,

inner_optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:852f400bc3990e5f035b9036bbfb0de6513b04b2808137df99cf8ed318bb534c
-size 8081781770

 version https://git-lfs.github.com/spec/v1
+oid sha256:33e565b43e3a803cc0103fbe6dbdc5b644c1a180748c66e5e50343726a6184fb
+size 8081782026

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9b49038fe6dd6f579da9d73ed6486a1118d277fec4e6beada6f1315f84b38771
 size 4040701744

 version https://git-lfs.github.com/spec/v1
+oid sha256:73efb0c1068249abe2eb6b6207f5e051b4312911446a9a1d544ec2cb71610cf7
 size 4040701744