A newer version of the Gradio SDK is available:
5.46.1
🔧 Configuración ZeroGPU Plan Pro para NTIA Space
📋 Problema Identificado
El Space NTIA está usando gpu.t4.micro
(plan gratuito) en lugar de gpu.h200.micro
(plan Pro), lo que causa:
- ❌ Límites de cuota de invitado
- ❌ "GPU task aborted" errors
- ❌ No acceso al plan Pro de 25 minutos/día
🛠️ Soluciones Implementadas
1. ✅ Decoradores Corregidos
Antes:
@spaces.GPU(compute_unit="gpu.t4.micro", timeout=30)
Después:
@spaces.GPU(compute_unit="gpu.h200.micro", timeout=30) # Plan Pro: H200 con 25 minutos/día
2. ✅ Configuración de Variables de Entorno
En el Space de Hugging Face, configura:
# Variables de entorno del Space
SPACES_GPU_TIMEOUT=30
SPACES_GPU_MEMORY=8
HF_TOKEN=tu_token_aqui
3. ✅ Verificación de Plan Pro
El Space ahora verifica automáticamente:
- ✅ Detección de H200 GPU
- ✅ Configuración de plan Pro
- ✅ Optimizaciones para H200
📊 Configuración del Space
Paso 1: Verificar Plan Pro en Hugging Face
- Ve a Hugging Face
- Inicia sesión con tu cuenta
- Ve a Settings → Billing
- Verifica que tengas ZeroGPU Plan Pro activo
Paso 2: Configurar Variables de Entorno del Space
- Ve a NTIA Space
- Ve a Settings → Repository secrets
- Agrega las siguientes variables:
HF_TOKEN=tu_token_aqui
SPACES_GPU_TIMEOUT=30
SPACES_GPU_MEMORY=8
Paso 3: Verificar Configuración
El Space debe mostrar en los logs:
✅ ZeroGPU H200 detectado - Plan Pro activo
🚀 Configuración optimizada para H200
🎯 Compute Unit: gpu.h200.micro
🔍 Verificación
Script de Verificación
Ejecuta el script de verificación:
python check_zero_gpu_config.py
Logs Esperados
🔧 Configurando ZeroGPU Plan Pro...
📊 Plan Pro: H200 con 25 minutos/día
🎯 Compute Unit: gpu.h200.micro
⏱️ Timeout: 30 segundos por request
✅ ZeroGPU H200 detectado - Plan Pro activo
🚀 Configuración optimizada para H200
🚀 Optimizaciones Implementadas
1. Configuración H200
- ⚡
torch.float16
para mayor velocidad - 🔧 Optimizaciones CUDA habilitadas
- 🎯 Configuración específica para H200
2. Timeouts Optimizados
- 🎨 Imágenes: 30 segundos
- 🎬 Videos: 60 segundos
- ⚡ Modelos turbo: 15 segundos
3. Parámetros Optimizados
- SDXL Turbo: 1 paso, guidance=0.0
- SD Turbo: 2 pasos, guidance≤1.0
- Modelos estándar: 15 pasos máximo
📈 Beneficios del Plan Pro
Característica | Plan Gratuito | Plan Pro |
---|---|---|
GPU | T4 | H200 |
Memoria | 16GB | 69.5GB |
Tiempo diario | 2 horas | 25 minutos |
Velocidad | Estándar | 3x más rápido |
Estabilidad | Limitada | Alta |
🔧 Troubleshooting
Error: "GPU task aborted"
Causa: Plan gratuito agotado Solución: Verificar plan Pro en Hugging Face
Error: "No se detectó GPU"
Causa: Space no configurado correctamente Solución: Verificar variables de entorno
Error: "Cuota agotada"
Causa: Usando plan gratuito Solución: Actualizar a plan Pro
📞 Soporte
Si persisten los problemas:
- Verifica el plan Pro en Hugging Face
- Revisa las variables de entorno del Space
- Ejecuta el script de verificación
- Contacta soporte de Hugging Face si es necesario