whathefish commited on Feb 14, 2023

Commit

badd8d7

1 Parent(s): 08a576a

Training in progress epoch 0

Browse files

Files changed (20) hide show

.gitignore +1 -0
README.md +54 -0
config.json +24 -0
runs/Feb13_22-50-23_Janniss-MBP/1676325028.7793531/events.out.tfevents.1676325028.Janniss-MBP.1424.1 +3 -0
runs/Feb13_22-50-23_Janniss-MBP/events.out.tfevents.1676325028.Janniss-MBP.1424.0 +3 -0
runs/Feb13_23-10-00_Janniss-MBP/1676326204.277919/events.out.tfevents.1676326204.Janniss-MBP.1424.3 +3 -0
runs/Feb13_23-10-00_Janniss-MBP/events.out.tfevents.1676326204.Janniss-MBP.1424.2 +3 -0
runs/Feb13_23-20-26_Janniss-MBP/1676326830.769512/events.out.tfevents.1676326830.Janniss-MBP.1776.1 +3 -0
runs/Feb13_23-20-26_Janniss-MBP/events.out.tfevents.1676326830.Janniss-MBP.1776.0 +3 -0
runs/Feb13_23-25-18_Janniss-MBP/1676327122.33038/events.out.tfevents.1676327122.Janniss-MBP.1776.3 +3 -0
runs/Feb13_23-25-18_Janniss-MBP/events.out.tfevents.1676327122.Janniss-MBP.1776.2 +3 -0
runs/Feb13_23-28-50_Janniss-MBP/1676327335.582318/events.out.tfevents.1676327335.Janniss-MBP.1776.5 +3 -0
runs/Feb13_23-28-50_Janniss-MBP/events.out.tfevents.1676327335.Janniss-MBP.1776.4 +3 -0
runs/Feb14_08-49-59_Janniss-MBP/1676361003.275512/events.out.tfevents.1676361003.Janniss-MBP.10037.1 +3 -0
runs/Feb14_08-49-59_Janniss-MBP/events.out.tfevents.1676361003.Janniss-MBP.10037.0 +3 -0
special_tokens_map.json +7 -0
tf_model.h5 +3 -0
tokenizer.json +0 -0
tokenizer_config.json +14 -0
vocab.txt +0 -0

.gitignore ADDED Viewed

	@@ -0,0 +1 @@


1	+ checkpoint-*/

README.md ADDED Viewed

	@@ -0,0 +1,54 @@

+---
+license: apache-2.0
+tags:
+- generated_from_keras_callback
+model-index:
+- name: whathefish/my_awesome_model
+  results: []
+---
+<!-- This model card has been generated automatically according to the information Keras had access to. You should
+probably proofread and complete it, then remove this comment. -->
+# whathefish/my_awesome_model
+This model is a fine-tuned version of [distilbert-base-german-cased](https://huggingface.co/distilbert-base-german-cased) on an unknown dataset.
+It achieves the following results on the evaluation set:
+- Train Loss: 0.5923
+- Validation Loss: 0.5516
+- Train Accuracy: 0.7467
+- Epoch: 0
+## Model description
+More information needed
+## Intended uses & limitations
+More information needed
+## Training and evaluation data
+More information needed
+## Training procedure
+### Training hyperparameters
+The following hyperparameters were used during training:
+- optimizer: {'name': 'Adam', 'learning_rate': {'class_name': 'PolynomialDecay', 'config': {'initial_learning_rate': 2e-05, 'decay_steps': 215, 'end_learning_rate': 0.0, 'power': 1.0, 'cycle': False, 'name': None}}, 'decay': 0.0, 'beta_1': 0.9, 'beta_2': 0.999, 'epsilon': 1e-08, 'amsgrad': False}
+- training_precision: float32
+### Training results
+| Train Loss | Validation Loss | Train Accuracy | Epoch |
+|:----------:|:---------------:|:--------------:|:-----:|
+| 0.5923     | 0.5516          | 0.7467         | 0     |
+### Framework versions
+- Transformers 4.26.1
+- TensorFlow 2.9.0
+- Datasets 2.9.0
+- Tokenizers 0.13.2

config.json ADDED Viewed

	@@ -0,0 +1,24 @@

+{
+  "_name_or_path": "distilbert-base-german-cased",
+  "activation": "gelu",
+  "architectures": [
+    "DistilBertForSequenceClassification"
+  ],
+  "attention_dropout": 0.1,
+  "dim": 768,
+  "dropout": 0.1,
+  "hidden_dim": 3072,
+  "initializer_range": 0.02,
+  "max_position_embeddings": 512,
+  "model_type": "distilbert",
+  "n_heads": 12,
+  "n_layers": 6,
+  "output_past": true,
+  "pad_token_id": 0,
+  "qa_dropout": 0.1,
+  "seq_classif_dropout": 0.2,
+  "sinusoidal_pos_embds": true,
+  "tie_weights_": true,
+  "transformers_version": "4.26.1",
+  "vocab_size": 31102
+}

runs/Feb13_22-50-23_Janniss-MBP/1676325028.7793531/events.out.tfevents.1676325028.Janniss-MBP.1424.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:54c17dfed734976bd1e6678347462c2bf7941a4cc2a1b978c8bc4bac482df5e3
+size 5663

runs/Feb13_22-50-23_Janniss-MBP/events.out.tfevents.1676325028.Janniss-MBP.1424.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:41b403c9223ac27bd28562d7d8e02240d34b871680f2665eeea2691a62e1237a
+size 3718

runs/Feb13_23-10-00_Janniss-MBP/1676326204.277919/events.out.tfevents.1676326204.Janniss-MBP.1424.3 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e5c94408898054a6eeab49787430545d49baffeaa464b1d680478e704af35b39
+size 5663

runs/Feb13_23-10-00_Janniss-MBP/events.out.tfevents.1676326204.Janniss-MBP.1424.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0b9d629e9ce29ab50577a0574c924f5324399d045c7861519433716449293315
+size 3802

runs/Feb13_23-20-26_Janniss-MBP/1676326830.769512/events.out.tfevents.1676326830.Janniss-MBP.1776.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:da27a9bea0311a32e4e42cd890054be516c2ffa9d29ddf65f4ad5a0e4ace8c33
+size 5663

runs/Feb13_23-20-26_Janniss-MBP/events.out.tfevents.1676326830.Janniss-MBP.1776.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:15015c500fdaf6204810f5385edb2a087f317c042f1831b1a830390b6647d57f
+size 3718

runs/Feb13_23-25-18_Janniss-MBP/1676327122.33038/events.out.tfevents.1676327122.Janniss-MBP.1776.3 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c9a7ca0696d7b526b8a96f0aaa7821865b681e93c54806e17c17a997d08f98d1
+size 5663

runs/Feb13_23-25-18_Janniss-MBP/events.out.tfevents.1676327122.Janniss-MBP.1776.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f014a022b2a6c7eded1b57a44a0fe7ad91e1364970eea69a69f94c324169346e
+size 3718

runs/Feb13_23-28-50_Janniss-MBP/1676327335.582318/events.out.tfevents.1676327335.Janniss-MBP.1776.5 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6df736c76216e3f88019a00dc26506e48061eaae2f96fe6fa5254e82810be69d
+size 5663

runs/Feb13_23-28-50_Janniss-MBP/events.out.tfevents.1676327335.Janniss-MBP.1776.4 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b08de06f117a82d7bb88673fa8d74a14aa41a4e950bdc1c7334f4ac733523196
+size 3718

runs/Feb14_08-49-59_Janniss-MBP/1676361003.275512/events.out.tfevents.1676361003.Janniss-MBP.10037.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ec2beada9d862a108b61dda2a29c2c93d8e43e2649099e6b3886780ae24ae043
+size 5663

runs/Feb14_08-49-59_Janniss-MBP/events.out.tfevents.1676361003.Janniss-MBP.10037.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:48bf63eeb537c4ae052eafbd8db5f6ba212933fc7fc8023a202ad2f81dd1716a
+size 3802

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
+}

tf_model.h5 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:aa284551b780a26180573930024b66571b3a80f5ca917028d2c23a524949431b
+size 269733656

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+  "cls_token": "[CLS]",
+  "do_lower_case": false,
+  "mask_token": "[MASK]",
+  "model_max_length": 512,
+  "name_or_path": "distilbert-base-german-cased",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "special_tokens_map_file": null,
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "DistilBertTokenizer",
+  "unk_token": "[UNK]"
+}

vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff