Step3 / app.py
Zenithwang's picture
Update app.py
9344577 verified
raw
history blame
3.62 kB
import io
import os
import base64
import gradio as gr
from PIL import Image
import httpx # Use httpx for direct API calls instead of openai SDK
# ------- 配置区 -------
# 推荐在 HF Space 的 Settings - Variables and secrets 里设置:
# Name: OPENAI_API_KEY Value: 你的 StepFun API Key
# 如果前台定义变量 (比如 STEPFUN_KEY),下面会依然被读取。
STEPFUN_ENDPOINT = "https://api.stepfun.com/v1"
MODEL_NAME = "step-3"
# --------------------
def _get_api_key() -> str:
"""
获取 API KEY,如果没有设置则返回 None。
首先尝试读取环境变量 OPENAI_API_KEY(OpenAI SDK 的默认约定),
如果不存在再尝试读取 STEPFUN_KEY。
"""
return os.getenv("OPENAI_API_KEY") or os.getenv("STEPFUN_KEY")
def _pil_to_data_url(img: Image.Image, fmt: str = "PNG") -> str:
"""
将 PIL 图片转换成 base64 Data URL。
接收一个 PIL.Image 对象和输出格式(默认为 PNG),
返回可用于 StepFun OpenAI 兼容接口的 data:image/...;base64,... 字符串。
"""
buf = io.BytesIO()
img.save(buf, format=fmt)
b64 = base64.b64encode(buf.getvalue()).decode("utf-8")
mime = "image/png" if fmt.upper() == "PNG" else "image/jpeg"
return f"data:{mime};base64,{b64}"
def _post_chat(messages: list, temperature: float = 0.7) -> str:
"""
调用 StepFun 的 chat/completions 接口并返回模型回复。
使用 httpx 库向 StepFun 的 OpenAI 兼容接口发送请求,
避免使用 openai SDK 导致的 "No API found" 错误。
messages 参数应符合 OpenAI 接口规范。
"""
key = _get_api_key()
if not key:
raise RuntimeError(
"API Key 未设置\n请到 Space 的 Settings - Variables and secrets 添加:\n"
"Name=OPENAI_API_KEY, Value=你的 StepFun API Key(或用 STEPFUN_KEY 也可)。"
)
url = f"{STEPFUN_ENDPOINT}/chat/completions"
headers = {
"Authorization": f"Bearer {key}",
"Content-Type": "application/json",
}
payload = {
"model": MODEL_NAME,
"messages": messages,
"temperature": temperature,
}
resp = httpx.post(url, headers=headers, json=payload, timeout=60)
resp.raise_for_status()
data = resp.json()
return data["choices"][0]["message"]["content"]
def chat_with_step3(image: Image.Image, question: str) -> str:
"""
调用 StepFun 的 step-3 模型进行推理。
首先检查上传的图像和问题文本是否有效,将图像编码为 data URL,
构造符合 OpenAI 接口规范的 messages 数组,然后通过 `_post_chat` 发送请求。
如遇异常则返回错误信息。
"""
if image is None:
return "请先上传图片。"
if not question:
question = "请描述这张图片。"
data_url = _pil_to_data_url(image, fmt="PNG")
messages = [
{
"role": "user",
"content": [
{"type": "image_url", "image_url": {"url": data_url}},
{"type": "text", "text": question},
],
},
]
try:
return _post_chat(messages)
except Exception as e:
return f"调用失败: {e!r}"
# 构建 Gradio 界面
iface = gr.Interface(
fn=chat_with_step3,
inputs=[
gr.Image(type="pil", label="Upload image"),
gr.Textbox(label="Question", placeholder="问点什么..."),
],
outputs=gr.Textbox(label="Answer"),
title="Step3",
description="step-3",
)
if __name__ == "__main__":
# 在 HF Spaces 里不需要 share=True
iface.launch()