Spaces:
Runtime error
Runtime error
# Hugging Face Spaces Deployment Guide | |
## 部署步骤 | |
### 1. 创建 Hugging Face Space | |
1. 访问 [Hugging Face Spaces](https://huggingface.co/new-space) | |
2. 选择 **Gradio** 作为 SDK | |
3. 选择合适的硬件(推荐 A10G 或更高配置,因为需要运行大模型) | |
4. 创建空间 | |
### 2. 上传必要文件 | |
将以下文件上传到你的 Hugging Face Space: | |
#### 必需文件: | |
- `demo/app.py` - 主应用文件 | |
- `requirements_hf.txt` - 重命名为 `requirements.txt` | |
- `packages.txt` - 系统依赖 | |
- `pre_build.py` - 预构建脚本 | |
- `README_HF.md` - 重命名为 `README.md` | |
#### 项目文件: | |
- `tools/` 目录及其所有内容 | |
- `demo/example_images/` 目录及示例图片 | |
- 其他必要的项目文件 | |
### 3. 配置文件说明 | |
#### `requirements.txt` | |
包含所有 Python 依赖,特别是: | |
- PyTorch 2.6.0 with CUDA support | |
- Transformers, Gradio 等核心库 | |
- GroundingDINO 相关依赖 | |
#### `packages.txt` | |
系统级依赖,包括: | |
- Git, wget (用于下载) | |
- OpenCV 相关库 | |
- 构建工具 | |
#### `pre_build.py` | |
自动化设置脚本,负责: | |
- 克隆和安装 GroundingDINO | |
- 下载预训练权重 | |
- 处理 torch 2.6 兼容性 | |
### 4. 重要注意事项 | |
#### 硬件要求 | |
- **最低配置**: A10G Small (24GB VRAM) | |
- **推荐配置**: A100-40GB 或更高 | |
- 需要足够的 VRAM 来加载 7B 模型和 GroundingDINO | |
#### 环境变量 | |
无需额外配置环境变量,脚本会自动检测 HF Spaces 环境。 | |
#### 构建时间 | |
首次部署可能需要 10-20 分钟,因为需要: | |
- 安装所有依赖 | |
- 克隆和编译 GroundingDINO | |
- 下载模型权重 | |
### 5. 常见问题 | |
#### 内存不足 | |
如果遇到 CUDA OOM 错误: | |
- 升级到更高配置的硬件 | |
- 考虑使用模型量化 | |
#### 构建失败 | |
如果预构建脚本失败: | |
- 检查 `packages.txt` 中的系统依赖 | |
- 确保所有文件路径正确 | |
- 查看构建日志确定具体错误 | |
#### 模型加载失败 | |
确保: | |
- 网络连接正常(用于下载模型) | |
- 有足够的存储空间 | |
- CUDA 环境正确配置 | |
### 6. 部署命令总结 | |
```bash | |
# 在本地准备文件 | |
cp requirements_hf.txt requirements.txt | |
cp README_HF.md README.md | |
# 上传到 HF Spaces(通过 Web 界面或 git) | |
git add . | |
git commit -m "Deploy to Hugging Face Spaces" | |
git push | |
``` | |
### 7. 验证部署 | |
部署成功后,应该能够: | |
1. 看到 Gradio 界面正常加载 | |
2. 上传图片并运行推理 | |
3. 看到 GroundingDINO 检测结果 | |
4. 获得 Rex-Thinker 的推理输出 | |
如果遇到问题,请查看 Space 的日志获取详细错误信息。 |