Spaces:

Sakalti
/

Testac-1002

Sleeping

App Files Files Community

Sakalti commited on Oct 12, 2024

Commit

1808c45

verified ·

1 Parent(s): d50d386

Create app.py

Browse files

Files changed (1) hide show

app.py +61 -0

app.py ADDED Viewed

	@@ -0,0 +1,61 @@

+import os
+import gradio as gr
+from transformers import AutoTokenizer, AutoModelForCausalLM, Trainer, TrainingArguments
+from datasets import load_dataset
+from huggingface_hub import login
+# Gradioで使うための関数
+def start_training(write_token, repo_name):
+    # Hugging Face APIトークンでログイン
+    login(token=write_token)
+    # データセットをロード
+    dataset = load_dataset("cc100", lang="ja")
+    # モデルとトークナイザーをロード
+    model_name = "Qwen/Qwen2.5-0.5B-Instruct"
+    tokenizer = AutoTokenizer.from_pretrained(model_name)
+    model = AutoModelForCausalLM.from_pretrained(model_name)
+    # トレーニング引数の設定
+    training_args = TrainingArguments(
+        output_dir="./results",          # 結果の保存先
+        num_train_epochs=3,              # エポック数
+        per_device_train_batch_size=8,   # バッチサイズ
+        per_device_eval_batch_size=8,    # 評価バッチサイズ
+        warmup_steps=500,                # ウォームアップステップ数
+        weight_decay=0.01,               # 重みの減衰
+        logging_dir="./logs",            # ログディレクトリ
+    )
+    # Trainerの設定
+    trainer = Trainer(
+        model=model,
+        args=training_args,
+        train_dataset=dataset["train"],
+        eval_dataset=dataset["test"],
+    )
+    # トレーニングの実行
+    trainer.train()
+    # トレーニングが完了した後にモデルをHugging Face Hubにアップロード
+    model.push_to_hub(repo_name)
+    tokenizer.push_to_hub(repo_name)
+    return f"トレーニングが完了しました。モデルが'{repo_name}'にアップロードされました。"
+# Gradioインターフェースを設定
+interface = gr.Interface(
+    fn=start_training,
+    inputs=[
+        gr.Textbox(label="Hugging Face Write Token"),
+        gr.Textbox(label="Hugging Face リポジトリ名")  # リポジトリパスの入力
+    ],
+    outputs="text",
+    title="モデル トレーニング",
+    description="このボタンを押すと、指定したトークンでトレーニングが開始されます。"
+)
+# アプリの起動
+interface.launch()