Spaces:

Sakalti
/

Testac-1002

Sleeping

Sakalti commited on Oct 17, 2024

Commit

90348a1

verified ·

1 Parent(s): 9c3e9e2

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -13,14 +13,14 @@ def start_training(write_token, repo_name):
     dataset = load_dataset("range3/cc100-ja")
     # モデルとトークナイザーをロード
-    model_name = "Qwen/Qwen2.5-0.5B-Instruct"
     tokenizer = AutoTokenizer.from_pretrained(model_name)
     model = AutoModelForCausalLM.from_pretrained(model_name)
     # トレーニング引数の設定
     training_args = TrainingArguments(
         output_dir="./results",          # 結果の保存先
-        num_train_epochs=3,              # エポック数
         per_device_train_batch_size=8,   # バッチサイズ
         per_device_eval_batch_size=8,    # 評価バッチサイズ
         warmup_steps=500,                # ウォームアップステップ数

     dataset = load_dataset("range3/cc100-ja")
     # モデルとトークナイザーをロード
+    model_name = "rinna/japanese-gpt-neox-small"
     tokenizer = AutoTokenizer.from_pretrained(model_name)
     model = AutoModelForCausalLM.from_pretrained(model_name)
     # トレーニング引数の設定
     training_args = TrainingArguments(
         output_dir="./results",          # 結果の保存先
+        num_train_epochs=2,              # エポック数
         per_device_train_batch_size=8,   # バッチサイズ
         per_device_eval_batch_size=8,    # 評価バッチサイズ
         warmup_steps=500,                # ウォームアップステップ数