Spaces:

malt666
/

abacus_chat_proxy

Running

App Files Files Community

malt666 commited on Mar 27

Commit

049292d

verified ·

1 Parent(s): aedde5e

Upload 5 files

Browse files

Files changed (2) hide show

README.md +11 -10
app.py +57 -38

README.md CHANGED Viewed

@@ -23,6 +23,10 @@ Check out the configuration reference at https://huggingface.co/docs/hub/spaces-
 [![Deploy to Hugging Face Spaces](https://huggingface.co/datasets/huggingface/badges/raw/main/deploy-to-spaces-lg.svg)](https://huggingface.co/spaces/malt666/abacus_chat_proxy?duplicate=true)
 ## 🚀 快速开始
 ### Hugging Face一键部署
@@ -31,13 +35,14 @@ Check out the configuration reference at https://huggingface.co/docs/hub/spaces-
 2. 登录你的Hugging Face账号（如果还没有，需要注册一个）
 3. 在弹出的页面中设置你的Space名称
 4. 创建完Space后，在Space的Settings -> Repository Secrets中添加以下配置：
-   - `covid_1`: 你的会话ID
    - `cookie_1`: 你的cookies字符串
    - `password`: （可选）访问密码
 5. 等待自动部署完成即可
-6. **获取API链接**：部署成功后，点击右上角的三个点按钮，在弹出的选项卡里面点击"Embed this Space"，然后在弹出的"Embed this Space"界面里的"Direct URL"就是你的访问链接，你可以用这个链接调用API
-### 本地运行
 #### Windows用户
@@ -66,12 +71,10 @@ chmod +x start.sh
 3. 在Space的设置中连接你的GitHub仓库
 4. 在Space的设置中添加以下Secrets：
    - 第1组配置：
-     - `covid_1`: 第1个会话ID
      - `cookie_1`: 第1个cookies字符串
    - 第2组配置（如果需要）：
-     - `covid_2`: 第2个会话ID
      - `cookie_2`: 第2个cookies字符串
-   - 更多配置以此类推（`covid_3`/`cookie_3`...）
    - `password`: （可选）访问密码
 5. Space会自动部署，服务将在 `https://你的空间名-你的用户名.hf.space` 上运行
@@ -99,15 +102,13 @@ PyJWT==2.8.0
 在Docker或云平台部署时，需要配置以下环境变量：
 - 必需的配置（至少需要一组）：
-  - `covid_1` + `cookie_1`: 第1组配置
-  - `covid_2` + `cookie_2`: 第2组配置（可选）
   - 以此类推...
 - 可选配置：
   - `password`: 访问密码
 ## 🔒 安全说明
-- 配置文件中的敏感信息请妥善保管
 - 建议在部署到Hugging Face时设置访问密码
-- 不要将包含敏感信息的配置文件提交到公开仓库
 - 在Hugging Face上配置时，请使用Secrets来存储敏感信息

 [![Deploy to Hugging Face Spaces](https://huggingface.co/datasets/huggingface/badges/raw/main/deploy-to-spaces-lg.svg)](https://huggingface.co/spaces/malt666/abacus_chat_proxy?duplicate=true)
+## ⚠️ 警告
+**本地部署方式已失效！**为了适配hugging face，本项目的本地部署方式已不再可用。目前只能通过Hugging Face Spaces部署来使用本代理服务。请使用下方的Hugging Face一键部署方法。
 ## 🚀 快速开始
 ### Hugging Face一键部署
 2. 登录你的Hugging Face账号（如果还没有，需要注册一个）
 3. 在弹出的页面中设置你的Space名称
 4. 创建完Space后，在Space的Settings -> Repository Secrets中添加以下配置：
    - `cookie_1`: 你的cookies字符串
    - `password`: （可选）访问密码
 5. 等待自动部署完成即可
+6. **获取API链接**：部署成功后，点击右上角的三个点按钮，在弹出的选项卡里面点击"Embed this Space"，然后在弹出的"Embed this Space"界面里的"Direct URL"就是你的访问链接，你可以用这个链接调用API和查看使用情况
+### 本地运行（已失效）
+> ⚠️ 以下本地运行方法已失效，仅作参考。请使用Hugging Face部署方式。
 #### Windows用户
 3. 在Space的设置中连接你的GitHub仓库
 4. 在Space的设置中添加以下Secrets：
    - 第1组配置：
      - `cookie_1`: 第1个cookies字符串
    - 第2组配置（如果需要）：
      - `cookie_2`: 第2个cookies字符串
+   - 更多配置以此类推（`cookie_3`...）
    - `password`: （可选）访问密码
 5. Space会自动部署，服务将在 `https://你的空间名-你的用户名.hf.space` 上运行
 在Docker或云平台部署时，需要配置以下环境变量：
 - 必需的配置（至少需要一组）：
+  - `cookie_1`: 第1组配置
+  - `cookie_2`: 第2组配置（可选）
   - 以此类推...
 - 可选配置：
   - `password`: 访问密码
 ## 🔒 安全说明
 - 建议在部署到Hugging Face时设置访问密码
 - 在Hugging Face上配置时，请使用Secrets来存储敏感信息

app.py CHANGED Viewed

@@ -58,7 +58,7 @@ total_tokens = {
 # 模型调用记录
 model_usage_records = []  # 每次调用详细记录
-MODEL_USAGE_RECORDS_FILE = "model_usage_records.json"  # 调用记录保存文件
 # 计算点信息
 compute_points = {
@@ -995,64 +995,61 @@ def index():
     return redirect(url_for('dashboard'))
-# 获取OpenAI的tokenizer来计算token数
-def num_tokens_from_string(string, model="gpt-3.5-turbo"):
-    """计算文本的token数量"""
     try:
-        encoding = tiktoken.encoding_for_model(model)
-        num_tokens = len(encoding.encode(string))
-        print(f"使用tiktoken计算token数: {num_tokens}")
-        return num_tokens
     except Exception as e:
-        # 如果tiktoken不支持模型或者出错，使用简单的估算
-        estimated_tokens = len(string) // 4  # 粗略估计每个token约4个字符
-        print(f"使用估算方法计算token数: {estimated_tokens} (原因: {str(e)})")
-        return estimated_tokens
 # 更新模型使用统计
 def update_model_stats(model, prompt_tokens, completion_tokens):
     global model_usage_stats, total_tokens, model_usage_records
-    # 添加调用记录
-    # 获取UTC时间
-    utc_now = datetime.utcnow()
-    # 转换为北京时间 (UTC+8)
-    beijing_time = utc_now + timedelta(hours=8)
-    call_time = beijing_time.strftime('%Y-%m-%d %H:%M:%S')  # 北京时间
-    record = {
-        "model": model,
-        "call_time": call_time,
-        "prompt_tokens": prompt_tokens,
-        "completion_tokens": completion_tokens,
-        "calculation_method": "tiktoken" if any(x in model.lower() for x in ["gpt", "claude"]) or model in ["llama-3", "mistral", "gemma"] else "estimate"
-    }
-    model_usage_records.append(record)
-    # 限制记录数量，保留最新的500条
-    if len(model_usage_records) > 500:
-        model_usage_records.pop(0)
-    # 保存调用记录到本地文件
-    save_model_usage_records()
-    # 更新聚合统计
     if model not in model_usage_stats:
         model_usage_stats[model] = {
             "count": 0,
             "prompt_tokens": 0,
-            "completion_tokens": 0,
-            "total_tokens": 0
         }
     model_usage_stats[model]["count"] += 1
     model_usage_stats[model]["prompt_tokens"] += prompt_tokens
     model_usage_stats[model]["completion_tokens"] += completion_tokens
-    model_usage_stats[model]["total_tokens"] += (prompt_tokens + completion_tokens)
     total_tokens["prompt"] += prompt_tokens
     total_tokens["completion"] += completion_tokens
     total_tokens["total"] += (prompt_tokens + completion_tokens)
 # 获取计算点信息
@@ -1294,10 +1291,32 @@ if SPACE_URL:
     print("注意：Hugging Face生成的URL会自动将空间名称中的下划线(_)替换为连字符(-)")
 if __name__ == "__main__":
     # 启动保活线程
     threading.Thread(target=keep_alive, daemon=True).start()
     # 加载历史模型调用记录
     load_model_usage_records()

 # 模型调用记录
 model_usage_records = []  # 每次调用详细记录
+MODEL_USAGE_RECORDS_FILE = "/app/model_usage_records.json"  # 调用记录保存文件，使用/app目录确保HF中持久化
 # 计算点信息
 compute_points = {
     return redirect(url_for('dashboard'))
+# 使用tiktoken计算字符串的token数量
+def num_tokens_from_string(text):
+    """使用tiktoken计算字符串的token数量"""
     try:
+        # 使用cl100k_base编码器，这是gpt-4和gpt-3.5-turbo使用的编码器
+        enc = tiktoken.get_encoding("cl100k_base")
+        tokens = enc.encode(text)
+        return len(tokens)
     except Exception as e:
+        # 如果出错，使用字符长度作为粗略估计（大约每4个字符1个token）
+        print(f"计算token数量出错: {e}，使用估算方法")
+        return len(text) // 4
 # 更新模型使用统计
 def update_model_stats(model, prompt_tokens, completion_tokens):
+    """更新模型使用统计数据"""
     global model_usage_stats, total_tokens, model_usage_records
+    # 获取北京时间
+    beijing_now = datetime.utcnow() + timedelta(hours=8)
+    call_time = beijing_now.strftime("%Y-%m-%d %H:%M:%S")
+    # 首次使用该模型时初始化统计
     if model not in model_usage_stats:
         model_usage_stats[model] = {
             "count": 0,
             "prompt_tokens": 0,
+            "completion_tokens": 0
         }
+    # 更新模型统计
     model_usage_stats[model]["count"] += 1
     model_usage_stats[model]["prompt_tokens"] += prompt_tokens
     model_usage_stats[model]["completion_tokens"] += completion_tokens
+    # 更新总token统计
     total_tokens["prompt"] += prompt_tokens
     total_tokens["completion"] += completion_tokens
     total_tokens["total"] += (prompt_tokens + completion_tokens)
+    # 添加使用记录
+    usage_record = {
+        "call_time": call_time,
+        "model": model,
+        "prompt_tokens": prompt_tokens,
+        "completion_tokens": completion_tokens,
+        "total_tokens": prompt_tokens + completion_tokens,
+        "calculation_method": "tiktoken"
+    }
+    model_usage_records.append(usage_record)
+    # 保存记录到文件，确保数据持久化
+    save_model_usage_records()
+    print(f"模型使用记录: {model}, 输入: {prompt_tokens}, 输出: {completion_tokens}, 时间: {call_time}")
 # 获取计算点信息
     print("注意：Hugging Face生成的URL会自动将空间名称中的下划线(_)替换为连字符(-)")
+# 定期保存token使用统计
+def auto_save_stats():
+    """定期自动保存token使用统计数据的线程函数"""
+    while True:
+        try:
+            # 每10分钟保存一次
+            time.sleep(600)
+            # 保存模型使用记录
+            save_model_usage_records()
+            print(f"已自动保存模型使用记录: {datetime.utcnow() + timedelta(hours=8)}")
+            # 每小时尝试重新加载记录，确保数据不丢失
+            if datetime.utcnow().minute < 10:  # 每小时的前10分钟执行
+                print("尝试重新加载模型使用记录...")
+                load_model_usage_records()
+        except Exception as e:
+            print(f"自动保存/加载模型使用记录出错: {e}")
 if __name__ == "__main__":
     # 启动保活线程
     threading.Thread(target=keep_alive, daemon=True).start()
+    # 启动自动保存统计数据的线程
+    threading.Thread(target=auto_save_stats, daemon=True).start()
     # 加载历史模型调用记录
     load_model_usage_records()