Spaces:

GOGO198
/

GOGO_rag

Sleeping

App Files Files Community

GOGO198 commited on Jun 26

Commit

9e5ab6c

verified ·

1 Parent(s): d19b751

Update app.py

Browse files

Files changed (1) hide show

app.py +14 -43

app.py CHANGED Viewed

@@ -14,18 +14,14 @@ CACHE_DIR = "/home/user/cache"
 os.makedirs(CACHE_DIR, exist_ok=True)
 # 减少内存占用
-# os.environ["PYTORCH_CUDA_ALLOC_CONF"] = "max_split_size_mb:32"
-# torch.set_num_threads(1)
 os.environ["OMP_NUM_THREADS"] = "2"
 os.environ["TOKENIZERS_PARALLELISM"] = "false"  # 防止tokenizer内存泄漏
-# 全局变量 - 移除了clip_model和clip_processor
 index = None
 metadata = None
-def respond(message):
-    return {"response": f"Echo: {message}"}  # 输出需与 API 响应格式一致
 def load_resources():
     """加载所有必要资源（768维专用）"""
     # 清理残留锁文件
@@ -128,7 +124,7 @@ def predict(vector):
         print(error_msg)
         return "处理错误，请重试或联系管理员"
-# 创建简化接口
 with gr.Blocks() as demo:
     gr.Markdown("## 🛍 电商智能客服系统 (768维专用)")
     gr.Markdown("**使用CLIP-vit-large-patch14模型 | 向量维度: 768**")
@@ -148,53 +144,28 @@ with gr.Blocks() as demo:
         inputs=vector_input,
         outputs=output
     )
 # 启动应用
 if __name__ == "__main__":
-    # 预加载资源
     if index is None or metadata is None:
-        print("🚀 启动前预加载资源...")
-        try:
-            load_resources()
-        except Exception as e:
-            print(f"⛔ 资源加载失败: {str(e)}")
-            sys.exit(1)
-    # 确保缓存目录存在
-    # import pathlib
-    # pathlib.Path(CACHE_DIR).mkdir(parents=True, exist_ok=True)
-    try:
-        dummy_vector = [0.1] * 768
-        predict([dummy_vector])
-    except:
-        pass
     print("="*50)
     print("Space启动完成 | 准备接收请求")
     print(f"索引维度: {index.d if index else '未加载'}")
     print(f"元数据记录: {len(metadata) if metadata is not None else 0}")
     print("="*50)
-    # 使用 Gradio 接口暴露 API 端点（自动生成 /api/predict）
-    # demo = gr.Interface(
-    #     fn=respond,
-    #     inputs="text",
-    #     outputs="json",
-    #     api_name="predict",
-    #     live=False
-    # )
-    with gr.Blocks() as app:
-        input_text = gr.Textbox(label="Input")
-        output_text = gr.JSON(label="Output")
-        input_text.change(
-            fn=respond,
-            inputs=input_text,
-            outputs=output_text,
-            api_name="predict"  # 显式声明 API 名称
-        )
     demo.launch(
         server_name="0.0.0.0",
         server_port=7860,

 os.makedirs(CACHE_DIR, exist_ok=True)
 # 减少内存占用
 os.environ["OMP_NUM_THREADS"] = "2"
 os.environ["TOKENIZERS_PARALLELISM"] = "false"  # 防止tokenizer内存泄漏
+# 全局变量
 index = None
 metadata = None
+# 加载资源函数（保持不变）
 def load_resources():
     """加载所有必要资源（768维专用）"""
     # 清理残留锁文件
         print(error_msg)
         return "处理错误，请重试或联系管理员"
+# **合并后的 Blocks 实例**
 with gr.Blocks() as demo:
     gr.Markdown("## 🛍 电商智能客服系统 (768维专用)")
     gr.Markdown("**使用CLIP-vit-large-patch14模型 | 向量维度: 768**")
         inputs=vector_input,
         outputs=output
     )
+    # 显式暴露 API 端点
+    gr.Interface(
+        fn=predict,
+        inputs=vector_input,
+        outputs=output,
+        api_name="predict"  # 显式声明 API 名称
+    )
 # 启动应用
 if __name__ == "__main__":
     if index is None or metadata is None:
+        load_resources()
+    # 验证 API 是否生成
     print("="*50)
     print("Space启动完成 | 准备接收请求")
     print(f"索引维度: {index.d if index else '未加载'}")
     print(f"元数据记录: {len(metadata) if metadata is not None else 0}")
     print("="*50)
+    # 启动应用（确保 API 暴露）
     demo.launch(
         server_name="0.0.0.0",
         server_port=7860,