Spaces:

nbugs
/

p2z

Running

App Files Files Community

nbugs commited on Mar 5

Commit

24b31be

verified ·

1 Parent(s): 1dcec7b

Upload 10 files

Browse files

Files changed (10) hide show

Dockerfile +46 -0
README.md +6 -4
awake.py +81 -0
build.sh +4 -0
gitattributes +36 -0
gitignore +2 -0
init_config.py +27 -0
model/doclayout_yolo_docstructbench_imgsz1024.onnx +3 -0
model/models%2F.gitkeep +0 -0
start.sh +12 -0

Dockerfile ADDED Viewed

	@@ -0,0 +1,46 @@

+ARG USERNAME
+ARG PASSWORD
+ARG OPENAI_API_KEY
+FROM python:3.12
+WORKDIR /app
+# 设置argostranslate专用缓存路径
+ENV ARGOS_TRANSLATE_PACKAGES_DIR=/app/.cache/argos-translate
+ENV ARGOS_TRANSLATE_DATA_DIR=/app/.cache/argos-translate
+ENV PYTHONUNBUFFERED=1
+RUN apt-get update && apt-get install -y libgl1 \
+    && rm -rf /var/lib/apt/lists/*
+# 创建缓存目录并设置权限
+RUN mkdir -p ${ARGOS_TRANSLATE_DATA_DIR} && \
+    chmod 777 ${ARGOS_TRANSLATE_DATA_DIR}
+# 添加非root用户
+RUN adduser --disabled-password --gecos "" appuser && \
+    chown -R appuser:appuser /app
+USER appuser
+ENV PATH="/home/appuser/.local/bin:${PATH}"
+RUN pip install --user pdf2zh
+WORKDIR /app
+COPY . .
+USER root
+RUN mkdir -p /home/appuser/.cache/babeldoc/models/ && \
+    chmod -R 777 /home/appuser/.cache/ && \
+    mv models/doclayout_yolo_docstructbench_imgsz1024.onnx /home/appuser/.cache/babeldoc/models/
+# ENV HF_ENDPOINT=https://hf-mirror.com
+# ENV HF_HUB_OFFLINE=1
+USER appuser
+EXPOSE 7860
+CMD ["/bin/bash", "start.sh"]

README.md CHANGED Viewed

@@ -1,10 +1,12 @@
 ---
-title: P2z
-emoji: 🐨
-colorFrom: pink
-colorTo: blue
 sdk: docker
 pinned: false
 ---
 Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

 ---
+title: p2z
+emoji: 📚
+colorFrom: blue
+colorTo: pink
 sdk: docker
 pinned: false
+license: mit
+short_description: 0q0q0q0
 ---
 Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

awake.py ADDED Viewed

	@@ -0,0 +1,81 @@

+import time
+import random
+import math
+from itertools import cycle
+def cpu_intensive_task():
+    """随机选择一个CPU密集型任务执行"""
+    tasks = [
+        _calculate_primes,
+        _matrix_multiplication,
+        _fibonacci_calculation,
+        _pi_calculation
+    ]
+    task = random.choice(tasks)
+    task()
+def _calculate_primes():
+    """计算质数"""
+    n = random.randint(100000, 1000000)
+    sieve = [True] * (n + 1)
+    sieve[0:2] = [False, False]
+    for i in range(2, int(math.sqrt(n)) + 1):
+        if sieve[i]:
+            sieve[i*i : n+1 : i] = [False] * len(sieve[i*i : n+1 : i])
+def _matrix_multiplication():
+    """矩阵乘法"""
+    size = random.randint(100, 300)
+    matrix = [[random.random() for _ in range(size)] for _ in range(size)]
+    result = [[0] * size for _ in range(size)]
+    for i in range(size):
+        for j in range(size):
+            for k in range(size):
+                result[i][j] += matrix[i][k] * matrix[k][j]
+def _fibonacci_calculation():
+    """斐波那契数列计算"""
+    n = random.randint(300000, 500000)
+    a, b = 0, 1
+    for _ in range(n):
+        a, b = b, a + b
+def _pi_calculation():
+    """蒙特卡洛法计算π近似值"""
+    iterations = 10000000
+    count = 0
+    for _ in range(iterations):
+        x = random.random()
+        y = random.random()
+        if x*x + y*y <= 1:
+            count += 1
+    pi = 4 * count / iterations
+def main():
+    try:
+        # 初始随机延迟 (5~15 分钟)
+        initial_delay = random.randint(5, 15)
+        time.sleep(initial_delay * 60)
+        # 创建间隔时间循环（10-300秒）
+        intervals = cycle([random.randint(10, 300) for _ in range(50)])
+        while True:
+            start_time = time.time()
+            print(f"开始CPU密集型任务 @ {time.strftime('%Y-%m-%d %H:%M:%S')}")
+            cpu_intensive_task()
+            elapsed = time.time() - start_time
+            print(f"任务完成，耗时: {elapsed:.2f}秒")
+            # 动态调整间隔时间
+            delay = next(intervals)
+            print(f"下次任务将在 {delay} 分钟后执行...")
+            time.sleep(delay * 60)
+    except KeyboardInterrupt:
+        print("\n任务调度已停止")
+if __name__ == "__main__":
+    main()

build.sh ADDED Viewed

	@@ -0,0 +1,4 @@

+docker build -t pdf-math-translator .
+docker run --rm -t -p 7860:7860 --name pdf --env-file .env pdf-math-translator
+# docker exec -it pdf /bin/bash

gitattributes ADDED Viewed

	@@ -0,0 +1,36 @@

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tar filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text
+models/doclayout_yolo_docstructbench_imgsz1024.onnx filter=lfs diff=lfs merge=lfs -text

gitignore ADDED Viewed

	@@ -0,0 +1,2 @@


1	+
2	+ .env

init_config.py ADDED Viewed

	@@ -0,0 +1,27 @@

+import os
+import json
+OPENAI_API_KEY: str = os.environ.get("OPENAI_API_KEY", "")
+if not OPENAI_API_KEY:
+    print("You Should Set OPENAI_API_KEY Enviroment.")
+    exit(-1)
+config = {
+    "USE_MODELSCOPE": "0",
+    "translators": [
+        {
+            "name": "openai",
+            "envs": {
+                # 设置环境变量
+                "OPENAI_BASE_URL": "https://megatrump-oneapi.hf.space/v1",
+                "OPENAI_API_KEY": OPENAI_API_KEY,
+                "OPENAI_MODEL": "gpt-4o-mini",
+            }
+        }
+    ]
+}
+with open("config.json", "w") as f:
+    json.dump(config, f)

model/doclayout_yolo_docstructbench_imgsz1024.onnx ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fece9af02f618b603ff7921ccec6861d13e7e1f9830e091dfb7e8ad9311e5b21
+size 75324598

model/models%2F.gitkeep ADDED Viewed

File without changes

start.sh ADDED Viewed

	@@ -0,0 +1,12 @@

+# 根据环境变量初始化用户名以及密码
+echo "${USERNAME},${PASSWORD}" > users.txt
+# 启动一个后台任务避免 Space 进入 Sleep 状态
+python3 awake.py &
+# 初始化环境变量
+python3 init_config.py
+# 启动 Server
+pdf2zh -i --config config.json --serverport 7860 -t 5 --authorized users.txt