Spaces:
Sleeping
Sleeping
Update app.py
Browse files
app.py
CHANGED
@@ -13,14 +13,14 @@ def start_training(write_token, repo_name):
|
|
13 |
dataset = load_dataset("range3/cc100-ja")
|
14 |
|
15 |
# モデルとトークナイザーをロード
|
16 |
-
model_name = "
|
17 |
tokenizer = AutoTokenizer.from_pretrained(model_name)
|
18 |
model = AutoModelForCausalLM.from_pretrained(model_name)
|
19 |
|
20 |
# トレーニング引数の設定
|
21 |
training_args = TrainingArguments(
|
22 |
output_dir="./results", # 結果の保存先
|
23 |
-
num_train_epochs=
|
24 |
per_device_train_batch_size=8, # バッチサイズ
|
25 |
per_device_eval_batch_size=8, # 評価バッチサイズ
|
26 |
warmup_steps=500, # ウォームアップステップ数
|
|
|
13 |
dataset = load_dataset("range3/cc100-ja")
|
14 |
|
15 |
# モデルとトークナイザーをロード
|
16 |
+
model_name = "rinna/japanese-gpt-neox-small"
|
17 |
tokenizer = AutoTokenizer.from_pretrained(model_name)
|
18 |
model = AutoModelForCausalLM.from_pretrained(model_name)
|
19 |
|
20 |
# トレーニング引数の設定
|
21 |
training_args = TrainingArguments(
|
22 |
output_dir="./results", # 結果の保存先
|
23 |
+
num_train_epochs=2, # エポック数
|
24 |
per_device_train_batch_size=8, # バッチサイズ
|
25 |
per_device_eval_batch_size=8, # 評価バッチサイズ
|
26 |
warmup_steps=500, # ウォームアップステップ数
|