Spaces:
Runtime error
Runtime error
File size: 2,560 Bytes
e0483c8 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 |
# Hugging Face Spaces Deployment Guide
## 部署步骤
### 1. 创建 Hugging Face Space
1. 访问 [Hugging Face Spaces](https://huggingface.co/new-space)
2. 选择 **Gradio** 作为 SDK
3. 选择合适的硬件(推荐 A10G 或更高配置,因为需要运行大模型)
4. 创建空间
### 2. 上传必要文件
将以下文件上传到你的 Hugging Face Space:
#### 必需文件:
- `demo/app.py` - 主应用文件
- `requirements_hf.txt` - 重命名为 `requirements.txt`
- `packages.txt` - 系统依赖
- `pre_build.py` - 预构建脚本
- `README_HF.md` - 重命名为 `README.md`
#### 项目文件:
- `tools/` 目录及其所有内容
- `demo/example_images/` 目录及示例图片
- 其他必要的项目文件
### 3. 配置文件说明
#### `requirements.txt`
包含所有 Python 依赖,特别是:
- PyTorch 2.6.0 with CUDA support
- Transformers, Gradio 等核心库
- GroundingDINO 相关依赖
#### `packages.txt`
系统级依赖,包括:
- Git, wget (用于下载)
- OpenCV 相关库
- 构建工具
#### `pre_build.py`
自动化设置脚本,负责:
- 克隆和安装 GroundingDINO
- 下载预训练权重
- 处理 torch 2.6 兼容性
### 4. 重要注意事项
#### 硬件要求
- **最低配置**: A10G Small (24GB VRAM)
- **推荐配置**: A100-40GB 或更高
- 需要足够的 VRAM 来加载 7B 模型和 GroundingDINO
#### 环境变量
无需额外配置环境变量,脚本会自动检测 HF Spaces 环境。
#### 构建时间
首次部署可能需要 10-20 分钟,因为需要:
- 安装所有依赖
- 克隆和编译 GroundingDINO
- 下载模型权重
### 5. 常见问题
#### 内存不足
如果遇到 CUDA OOM 错误:
- 升级到更高配置的硬件
- 考虑使用模型量化
#### 构建失败
如果预构建脚本失败:
- 检查 `packages.txt` 中的系统依赖
- 确保所有文件路径正确
- 查看构建日志确定具体错误
#### 模型加载失败
确保:
- 网络连接正常(用于下载模型)
- 有足够的存储空间
- CUDA 环境正确配置
### 6. 部署命令总结
```bash
# 在本地准备文件
cp requirements_hf.txt requirements.txt
cp README_HF.md README.md
# 上传到 HF Spaces(通过 Web 界面或 git)
git add .
git commit -m "Deploy to Hugging Face Spaces"
git push
```
### 7. 验证部署
部署成功后,应该能够:
1. 看到 Gradio 界面正常加载
2. 上传图片并运行推理
3. 看到 GroundingDINO 检测结果
4. 获得 Rex-Thinker 的推理输出
如果遇到问题,请查看 Space 的日志获取详细错误信息。 |