Spaces:

AlphaPhoenix
/

MATRIX

Sleeping

laserbeam2045 commited on May 4

Commit

a37edf7

1 Parent(s): 9fa7b35

fix

Files changed (1) hide show

app.py CHANGED Viewed

@@ -9,10 +9,10 @@ from llama_cpp import Llama # llama-cpp-python をインポート
 # Hugging Face Hub の設定
 # -----------------------------------------------------------------------------
 HF_TOKEN = os.environ.get("HF_TOKEN")  # 必要に応じて Secrets にセット
-REPO_ID  = "google/gemma-3-4b-it-qat-q4_0-gguf"
-# 実際にリポジトリに置かれている GGUF ファイル名を確認してください。
-# 例: "gemma-3-12b-it-qat-q4_0-gguf.gguf"
-GGUF_FILENAME = "gemma-3-4b-it-q4_0.gguf"
 # キャッシュ先のパス（リポジトリ直下に置く場合）
 MODEL_PATH = os.path.join(os.getcwd(), GGUF_FILENAME)
@@ -54,7 +54,8 @@ except Exception as e:
 # -----------------------------------------------------------------------------
 # FastAPI 定義
 # -----------------------------------------------------------------------------
-app = FastAPI(title="Gemma3-4B-IT Q4_0 GGUF API")
 @app.get("/")
 async def read_root():
@@ -101,3 +102,5 @@ import uvicorn
 port = int(os.environ.get("PORT", 8000))
 # host="0.0.0.0" でコンテナ外からのアクセスを許可
 uvicorn.run(app, host="0.0.0.0", port=port, log_level="info")

 # Hugging Face Hub の設定
 # -----------------------------------------------------------------------------
 HF_TOKEN = os.environ.get("HF_TOKEN")  # 必要に応じて Secrets にセット
+# より軽量な Gemma 2B モデルに変更
+REPO_ID  = "google/gemma-2b-it-gguf"
+# Gemma 2B の Q4_0 GGUF ファイル名 (リポジトリで確認)
+GGUF_FILENAME = "gemma-2b-it-q4_0.gguf"
 # キャッシュ先のパス（リポジトリ直下に置く場合）
 MODEL_PATH = os.path.join(os.getcwd(), GGUF_FILENAME)
 # -----------------------------------------------------------------------------
 # FastAPI 定義
 # -----------------------------------------------------------------------------
+# タイトルもモデルに合わせて変更
+app = FastAPI(title="Gemma-2B-IT Q4_0 GGUF API")
 @app.get("/")
 async def read_root():
 port = int(os.environ.get("PORT", 8000))
 # host="0.0.0.0" でコンテナ外からのアクセスを許可
 uvicorn.run(app, host="0.0.0.0", port=port, log_level="info")
+# curl -X POST https://alphaphoenix-matrix.hf.space/generate -H "Content-Type: application/json" -d '{"prompt": "日本の首都は？"}'