import io import os import base64 import gradio as gr from PIL import Image import httpx # Use httpx for direct API calls instead of openai SDK # ------- 配置区 ------- # 推荐在 HF Space 的 Settings - Variables and secrets 里设置: # Name: OPENAI_API_KEY Value: 你的 StepFun API Key # 如果前台定义变量 (比如 STEPFUN_KEY),下面会依然被读取。 STEPFUN_ENDPOINT = "https://api.stepfun.com/v1" MODEL_NAME = "step-3" # -------------------- def _get_api_key() -> str: """ 获取 API KEY,如果没有设置则返回 None。 首先尝试读取环境变量 OPENAI_API_KEY(OpenAI SDK 的默认约定), 如果不存在再尝试读取 STEPFUN_KEY。 """ return os.getenv("OPENAI_API_KEY") or os.getenv("STEPFUN_KEY") def _pil_to_data_url(img: Image.Image, fmt: str = "PNG") -> str: """ 将 PIL 图片转换成 base64 Data URL。 接收一个 PIL.Image 对象和输出格式(默认为 PNG), 返回可用于 StepFun OpenAI 兼容接口的 data:image/...;base64,... 字符串。 """ buf = io.BytesIO() img.save(buf, format=fmt) b64 = base64.b64encode(buf.getvalue()).decode("utf-8") mime = "image/png" if fmt.upper() == "PNG" else "image/jpeg" return f"data:{mime};base64,{b64}" def _post_chat(messages: list, temperature: float = 0.7) -> str: """ 调用 StepFun 的 chat/completions 接口并返回模型回复。 使用 httpx 库向 StepFun 的 OpenAI 兼容接口发送请求, 避免使用 openai SDK 导致的 "No API found" 错误。 messages 参数应符合 OpenAI 接口规范。 """ key = _get_api_key() if not key: raise RuntimeError( "API Key 未设置\n请到 Space 的 Settings - Variables and secrets 添加:\n" "Name=OPENAI_API_KEY, Value=你的 StepFun API Key(或用 STEPFUN_KEY 也可)。" ) url = f"{STEPFUN_ENDPOINT}/chat/completions" headers = { "Authorization": f"Bearer {key}", "Content-Type": "application/json", } payload = { "model": MODEL_NAME, "messages": messages, "temperature": temperature, } resp = httpx.post(url, headers=headers, json=payload, timeout=60) resp.raise_for_status() data = resp.json() return data["choices"][0]["message"]["content"] def chat_with_step3(image: Image.Image, question: str) -> str: """ 调用 StepFun 的 step-3 模型进行推理。 首先检查上传的图像和问题文本是否有效,将图像编码为 data URL, 构造符合 OpenAI 接口规范的 messages 数组,然后通过 `_post_chat` 发送请求。 如遇异常则返回错误信息。 """ if image is None: return "请先上传图片。" if not question: question = "请描述这张图片。" data_url = _pil_to_data_url(image, fmt="PNG") messages = [ { "role": "user", "content": [ {"type": "image_url", "image_url": {"url": data_url}}, {"type": "text", "text": question}, ], }, ] try: return _post_chat(messages) except Exception as e: return f"调用失败: {e!r}" # 构建 Gradio 界面 iface = gr.Interface( fn=chat_with_step3, inputs=[ gr.Image(type="pil", label="Upload image"), gr.Textbox(label="Question", placeholder="问点什么..."), ], outputs=gr.Textbox(label="Answer"), title="Step3 (API) Demo", description="使用 StepFun 的 OpenAI 兼容 API (/v1) 来调用 step-3 模型。", ) if __name__ == "__main__": # 在 HF Spaces 里不需要 share=True iface.launch()