Spaces:

GOGO198
/

GOGO_rag

Running

App Files Files Community

GOGO198 commited on Jun 27

Commit

e931572

verified ·

1 Parent(s): ebc728e

Update app.py

Browse files

Files changed (1) hide show

app.py +28 -46

app.py CHANGED Viewed

@@ -6,7 +6,6 @@ import pandas as pd
 import faiss
 from huggingface_hub import hf_hub_download
 import time
-import sys
 import json
 # 创建安全缓存目录
@@ -15,15 +14,16 @@ os.makedirs(CACHE_DIR, exist_ok=True)
 # 减少内存占用
 os.environ["OMP_NUM_THREADS"] = "2"
-os.environ["TOKENIZERS_PARALLELISM"] = "false"  # 防止tokenizer内存泄漏
 # 全局变量
 index = None
 metadata = None
-# 加载资源函数（保持不变）
 def load_resources():
     """加载所有必要资源（768维专用）"""
     # 清理残留锁文件
     lock_files = [f for f in os.listdir(CACHE_DIR) if f.endswith('.lock')]
     for lock_file in lock_files:
@@ -31,13 +31,10 @@ def load_resources():
             os.remove(os.path.join(CACHE_DIR, lock_file))
             print(f"🧹 清理锁文件: {lock_file}")
         except: pass
-    global index, metadata
-    # 仅当资源未加载时才初始化
     if index is None or metadata is None:
         print("🔄 正在加载所有资源...")
         # 加载FAISS索引（768维）
         if index is None:
             print("📥 正在下载FAISS索引...")
@@ -50,20 +47,14 @@ def load_resources():
                 )
                 index = faiss.read_index(INDEX_PATH)
-                # 验证索引维度
                 if index.d != 768:
-                    raise ValueError(f"❌ 索引维度错误：预期768维，实际{index.d}维")
-                # if index and not index.is_trained:
-                #     print("🔧 训练量化索引...")
-                #     index.train(np.random.rand(10000, 768).astype('float32'))
-                #     print("✅ 索引训练完成")
                 print(f"✅ FAISS索引加载完成 | 维度: {index.d}")
             except Exception as e:
                 print(f"❌ FAISS索引加载失败: {str(e)}")
                 raise
         # 加载元数据
         if metadata is None:
             print("📄 正在下载元数据...")
@@ -86,9 +77,8 @@ def predict(vector):
     """处理768维向量输入并返回答案"""
     start_time = time.time()
     print(f"输入向量维度: {np.array(vector).shape}")
     try:
-        # 验证输入格式
         if not isinstance(vector, list) or len(vector) == 0:
             error_msg = "错误：输入格式无效"
             print(error_msg)
@@ -98,11 +88,10 @@ def predict(vector):
             error_msg = f"错误：需要1x768的二维数组，收到{len(vector)}x{len(vector[0]) if vector else 0}"
             print(error_msg)
             return error_msg
-        # 添加实际处理逻辑
         vector_array = np.array(vector, dtype=np.float32)
         D, I = index.search(vector_array, k=3)
         results = []
         for i in range(3):
             try:
@@ -112,10 +101,10 @@ def predict(vector):
             except Exception as e:
                 print(f"结果处理错误: {str(e)}")
                 results.append(f"结果 {i+1}: 数据获取失败")
         print(f"处理完成 | 耗时: {time.time()-start_time:.2f}秒")
         return json.dumps({
-            "results": results  # 确保嵌套结构合法
         })
     except Exception as e:
@@ -124,7 +113,7 @@ def predict(vector):
         print(error_msg)
         return "处理错误，请重试或联系管理员"
-# **合并后的 Blocks 实例**
 with gr.Blocks() as demo:
     gr.Markdown("## 🛍 电商智能客服系统 (768维专用)")
     gr.Markdown("**使用CLIP-vit-large-patch14模型 | 向量维度: 768**")
@@ -134,7 +123,7 @@ with gr.Blocks() as demo:
             headers=["向量值"],
             type="array",
             label="输入向量 (768维)",
-            value=[[0.1]*768]  # 768维默认值
         )
         output = gr.Textbox(label="智能回答", lines=5)
@@ -145,36 +134,29 @@ with gr.Blocks() as demo:
         outputs=output
     )
-    # 显式暴露 API 端点（关键修改）
-    #demo.express_api(predict, input=vector_input, output=output, api_name="predict")
-# 确保 API 输入输出与界面组件完全一致
-api = gr.Interface(
-    fn=predict,
-    inputs=gr.Dataframe(  # 与 vector_input 完全相同
-        headers=["向量值"],
-        type="array",
-        value=[[0.1]*768]
-    ),
-    outputs=gr.Textbox(),  # 与 output 类型一致
-    api_name="predict"  # 显式声明 API 名称
-)
-# 启动应用
 if __name__ == "__main__":
     if index is None or metadata is None:
         load_resources()
-    # 验证 API 是否生��
     print("="*50)
     print("Space启动完成 | 准备接收请求")
     print(f"索引维度: {index.d if index else '未加载'}")
     print(f"元数据记录: {len(metadata) if metadata is not None else 0}")
     print("="*50)
-    # 启动应用（确保 API 暴露）
-    api.launch(
         server_name="0.0.0.0",
         server_port=7860,
         ssr_mode=False
-    )

 import faiss
 from huggingface_hub import hf_hub_download
 import time
 import json
 # 创建安全缓存目录
 # 减少内存占用
 os.environ["OMP_NUM_THREADS"] = "2"
+os.environ["TOKENIZERS_PARALLELISM"] = "false"
 # 全局变量
 index = None
 metadata = None
 def load_resources():
     """加载所有必要资源（768维专用）"""
+    global index, metadata
     # 清理残留锁文件
     lock_files = [f for f in os.listdir(CACHE_DIR) if f.endswith('.lock')]
     for lock_file in lock_files:
             os.remove(os.path.join(CACHE_DIR, lock_file))
             print(f"🧹 清理锁文件: {lock_file}")
         except: pass
     if index is None or metadata is None:
         print("🔄 正在加载所有资源...")
         # 加载FAISS索引（768维）
         if index is None:
             print("📥 正在下载FAISS索引...")
                 )
                 index = faiss.read_index(INDEX_PATH)
                 if index.d != 768:
+                    raise ValueError("❌ 索引维度错误：预期768维")
                 print(f"✅ FAISS索引加载完成 | 维度: {index.d}")
             except Exception as e:
                 print(f"❌ FAISS索引加载失败: {str(e)}")
                 raise
         # 加载元数据
         if metadata is None:
             print("📄 正在下载元数据...")
     """处理768维向量输入并返回答案"""
     start_time = time.time()
     print(f"输入向量维度: {np.array(vector).shape}")
     try:
         if not isinstance(vector, list) or len(vector) == 0:
             error_msg = "错误：输入格式无效"
             print(error_msg)
             error_msg = f"错误：需要1x768的二维数组，收到{len(vector)}x{len(vector[0]) if vector else 0}"
             print(error_msg)
             return error_msg
         vector_array = np.array(vector, dtype=np.float32)
         D, I = index.search(vector_array, k=3)
         results = []
         for i in range(3):
             try:
             except Exception as e:
                 print(f"结果处理错误: {str(e)}")
                 results.append(f"结果 {i+1}: 数据获取失败")
         print(f"处理完成 | 耗时: {time.time()-start_time:.2f}秒")
         return json.dumps({
+            "results": results
         })
     except Exception as e:
         print(error_msg)
         return "处理错误，请重试或联系管理员"
+# 创建Blocks应用
 with gr.Blocks() as demo:
     gr.Markdown("## 🛍 电商智能客服系统 (768维专用)")
     gr.Markdown("**使用CLIP-vit-large-patch14模型 | 向量维度: 768**")
             headers=["向量值"],
             type="array",
             label="输入向量 (768维)",
+            value=[[0.1]*768]
         )
         output = gr.Textbox(label="智能回答", lines=5)
         outputs=output
     )
+    # 暴露为API
+    demo.expose_api(
+        fn=predict,
+        input=vector_input,
+        output=output,
+        api_name="predict"
+    )
+# 在Blocks内部加载资源
 if __name__ == "__main__":
     if index is None or metadata is None:
         load_resources()
+    # 验证API
     print("="*50)
     print("Space启动完成 | 准备接收请求")
     print(f"索引维度: {index.d if index else '未加载'}")
     print(f"元数据记录: {len(metadata) if metadata is not None else 0}")
     print("="*50)
+    # 启动应用
+    demo.launch(
         server_name="0.0.0.0",
         server_port=7860,
         ssr_mode=False
+    )