A newer version of the Gradio SDK is available:
5.47.2
📋 Resumen de Correcciones - NTIA Space
🎯 Problema Principal Identificado
El Space NTIA estaba usando el plan gratuito de ZeroGPU (gpu.t4.micro
) en lugar del plan Pro (gpu.h200.micro
), causando:
- ❌ Errores "GPU task aborted"
- ❌ Límites de cuota de invitado
- ❌ No acceso a H200 con 25 minutos/día
✅ Correcciones Implementadas
1. Decoradores ZeroGPU Corregidos
Antes:
@spaces.GPU(compute_unit="gpu.t4.micro", timeout=30)
@spaces.GPU(compute_unit="gpu.t4.micro", timeout=60)
Después:
@spaces.GPU(compute_unit="gpu.h200.micro", timeout=30) # Plan Pro: H200 con 25 minutos/día
@spaces.GPU(compute_unit="gpu.h200.micro", timeout=60) # Plan Pro: H200 con 25 minutos/día
2. Configuración de Verificación de Plan Pro
Agregado al inicio del app.py
:
# Configuración específica para ZeroGPU Plan Pro
print("🔧 Configurando ZeroGPU Plan Pro...")
print("📊 Plan Pro: H200 con 25 minutos/día")
print("🎯 Compute Unit: gpu.h200.micro")
print("⏱️ Timeout: 30 segundos por request")
# Verificar que estamos usando el plan Pro correcto
if torch.cuda.is_available():
gpu_name = torch.cuda.get_device_name(0)
if "H200" in gpu_name:
print("✅ ZeroGPU H200 detectado - Plan Pro activo")
print("🚀 Configuración optimizada para H200")
else:
print(f"⚠️ GPU detectada: {gpu_name}")
print("💡 Considera actualizar al plan Pro para mejor rendimiento")
else:
print("❌ No se detectó GPU - ejecutando en CPU")
3. Funciones de Verificación Agregadas
def check_auth():
"""Verificar si el usuario está autenticado con HF_TOKEN"""
def check_quota():
"""Verificar el estado de la cuota de ZeroGPU"""
def get_space_status():
"""Obtener estado completo del Space"""
4. Tab de Estado del Space
Agregado nuevo tab para verificar el estado:
# Tab de Estado del Space
with gr.TabItem("🔍 Estado del Space"):
# Interfaz para verificar autenticación y cuota
📊 Comparación de Planes
Característica | Plan Gratuito (T4) | Plan Pro (H200) |
---|---|---|
GPU | NVIDIA T4 | NVIDIA H200 |
Memoria | 16GB | 69.5GB |
Tiempo diario | 2 horas | 25 minutos |
Velocidad | Estándar | 3x más rápido |
Estabilidad | Limitada | Alta |
Compute Unit | gpu.t4.micro |
gpu.h200.micro |
🔧 Configuración Requerida en Hugging Face
Variables de Entorno del Space:
HF_TOKEN=tu_token_aqui
SPACES_GPU_TIMEOUT=30
SPACES_GPU_MEMORY=8
Plan Pro Activo:
- Verificar en Settings → Billing
- ZeroGPU Plan Pro debe estar activo
- 25 minutos/día disponibles
🚀 Optimizaciones Implementadas
1. Configuración H200
- ⚡
torch.float16
para mayor velocidad - 🔧 Optimizaciones CUDA habilitadas
- 🎯 Configuración específica para H200
2. Timeouts Optimizados
- 🎨 Imágenes: 30 segundos
- 🎬 Videos: 60 segundos
- ⚡ Modelos turbo: 15 segundos
3. Parámetros Optimizados
- SDXL Turbo: 1 paso, guidance=0.0
- SD Turbo: 2 pasos, guidance≤1.0
- Modelos estándar: 15 pasos máximo
📁 Archivos Modificados
app.py
- Decoradores y configuración principalcheck_zero_gpu_config.py
- Script de verificaciónCONFIGURACION_ZEROGPU_PRO.md
- Documentación de configuraciónRESUMEN_CORRECCIONES.md
- Este resumen
🔍 Verificación
Script de Verificación:
python check_zero_gpu_config.py
Logs Esperados:
🔧 Configurando ZeroGPU Plan Pro...
📊 Plan Pro: H200 con 25 minutos/día
🎯 Compute Unit: gpu.h200.micro
⏱️ Timeout: 30 segundos por request
✅ ZeroGPU H200 detectado - Plan Pro activo
🚀 Configuración optimizada para H200
⚠️ Próximos Pasos
- Verificar Plan Pro en Hugging Face
- Configurar variables de entorno del Space
- Desplegar cambios al Space
- Probar generación de imágenes/videos
- Verificar logs del Space
📞 Troubleshooting
Error: "GPU task aborted"
- Verificar plan Pro en Hugging Face
- Confirmar variables de entorno del Space
Error: "Cuota agotada"
- Verificar tiempo restante del plan Pro
- Esperar reinicio diario de cuota
Error: "No se detectó GPU"
- Verificar configuración del Space
- Contactar soporte de Hugging Face
Estado: ✅ Correcciones implementadas Próximo paso: Desplegar al Space y verificar funcionamiento