Sakalti commited on
Commit
90348a1
·
verified ·
1 Parent(s): 9c3e9e2

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +2 -2
app.py CHANGED
@@ -13,14 +13,14 @@ def start_training(write_token, repo_name):
13
  dataset = load_dataset("range3/cc100-ja")
14
 
15
  # モデルとトークナイザーをロード
16
- model_name = "Qwen/Qwen2.5-0.5B-Instruct"
17
  tokenizer = AutoTokenizer.from_pretrained(model_name)
18
  model = AutoModelForCausalLM.from_pretrained(model_name)
19
 
20
  # トレーニング引数の設定
21
  training_args = TrainingArguments(
22
  output_dir="./results", # 結果の保存先
23
- num_train_epochs=3, # エポック数
24
  per_device_train_batch_size=8, # バッチサイズ
25
  per_device_eval_batch_size=8, # 評価バッチサイズ
26
  warmup_steps=500, # ウォームアップステップ数
 
13
  dataset = load_dataset("range3/cc100-ja")
14
 
15
  # モデルとトークナイザーをロード
16
+ model_name = "rinna/japanese-gpt-neox-small"
17
  tokenizer = AutoTokenizer.from_pretrained(model_name)
18
  model = AutoModelForCausalLM.from_pretrained(model_name)
19
 
20
  # トレーニング引数の設定
21
  training_args = TrainingArguments(
22
  output_dir="./results", # 結果の保存先
23
+ num_train_epochs=2, # エポック数
24
  per_device_train_batch_size=8, # バッチサイズ
25
  per_device_eval_batch_size=8, # 評価バッチサイズ
26
  warmup_steps=500, # ウォームアップステップ数