Spaces:

AlphaPhoenix
/

MATRIX

Sleeping

laserbeam2045 commited on May 4

Commit

ea7fb9b

1 Parent(s): cc45514

fix

Files changed (1) hide show

app.py CHANGED Viewed

@@ -9,10 +9,10 @@ from llama_cpp import Llama # llama-cpp-python をインポート
 # Hugging Face Hub の設定
 # -----------------------------------------------------------------------------
 HF_TOKEN = os.environ.get("HF_TOKEN")  # 必要に応じて Secrets にセット
-REPO_ID  = "google/gemma-3-12b-it-qat-q4_0-gguf"
 # 実際にリポジトリに置かれている GGUF ファイル名を確認してください。
 # 例: "gemma-3-12b-it-qat-q4_0-gguf.gguf"
-GGUF_FILENAME = "gemma-3-12b-it-q4_0.gguf"
 # キャッシュ先のパス（リポジトリ直下に置く場合）
 MODEL_PATH = os.path.join(os.getcwd(), GGUF_FILENAME)
@@ -54,7 +54,7 @@ except Exception as e:
 # -----------------------------------------------------------------------------
 # FastAPI 定義
 # -----------------------------------------------------------------------------
-app = FastAPI(title="Gemma3-12B-IT Q4_0 GGUF API")
 class GenerationRequest(BaseModel):
     prompt: str

 # Hugging Face Hub の設定
 # -----------------------------------------------------------------------------
 HF_TOKEN = os.environ.get("HF_TOKEN")  # 必要に応じて Secrets にセット
+REPO_ID  = "google/gemma-3-4b-it-qat-q4_0-gguf"
 # 実際にリポジトリに置かれている GGUF ファイル名を確認してください。
 # 例: "gemma-3-12b-it-qat-q4_0-gguf.gguf"
+GGUF_FILENAME = "gemma-3-4b-it-q4_0.gguf"
 # キャッシュ先のパス（リポジトリ直下に置く場合）
 MODEL_PATH = os.path.join(os.getcwd(), GGUF_FILENAME)
 # -----------------------------------------------------------------------------
 # FastAPI 定義
 # -----------------------------------------------------------------------------
+app = FastAPI(title="Gemma3-4B-IT Q4_0 GGUF API")
 class GenerationRequest(BaseModel):
     prompt: str