ntia / CONFIGURACION_ZEROGPU_PRO.md
Ntdeseb's picture
Agregar funcionalidad de gráficos vectoriales SVG con SVGDreamer y modelos Microsoft
8d8ad99

A newer version of the Gradio SDK is available: 5.46.1

Upgrade

🔧 Configuración ZeroGPU Plan Pro para NTIA Space

📋 Problema Identificado

El Space NTIA está usando gpu.t4.micro (plan gratuito) en lugar de gpu.h200.micro (plan Pro), lo que causa:

  • ❌ Límites de cuota de invitado
  • ❌ "GPU task aborted" errors
  • ❌ No acceso al plan Pro de 25 minutos/día

🛠️ Soluciones Implementadas

1. ✅ Decoradores Corregidos

Antes:

@spaces.GPU(compute_unit="gpu.t4.micro", timeout=30)

Después:

@spaces.GPU(compute_unit="gpu.h200.micro", timeout=30)  # Plan Pro: H200 con 25 minutos/día

2. ✅ Configuración de Variables de Entorno

En el Space de Hugging Face, configura:

# Variables de entorno del Space
SPACES_GPU_TIMEOUT=30
SPACES_GPU_MEMORY=8
HF_TOKEN=tu_token_aqui

3. ✅ Verificación de Plan Pro

El Space ahora verifica automáticamente:

  • ✅ Detección de H200 GPU
  • ✅ Configuración de plan Pro
  • ✅ Optimizaciones para H200

📊 Configuración del Space

Paso 1: Verificar Plan Pro en Hugging Face

  1. Ve a Hugging Face
  2. Inicia sesión con tu cuenta
  3. Ve a Settings → Billing
  4. Verifica que tengas ZeroGPU Plan Pro activo

Paso 2: Configurar Variables de Entorno del Space

  1. Ve a NTIA Space
  2. Ve a Settings → Repository secrets
  3. Agrega las siguientes variables:
HF_TOKEN=tu_token_aqui
SPACES_GPU_TIMEOUT=30
SPACES_GPU_MEMORY=8

Paso 3: Verificar Configuración

El Space debe mostrar en los logs:

✅ ZeroGPU H200 detectado - Plan Pro activo
🚀 Configuración optimizada para H200
🎯 Compute Unit: gpu.h200.micro

🔍 Verificación

Script de Verificación

Ejecuta el script de verificación:

python check_zero_gpu_config.py

Logs Esperados

🔧 Configurando ZeroGPU Plan Pro...
📊 Plan Pro: H200 con 25 minutos/día
🎯 Compute Unit: gpu.h200.micro
⏱️ Timeout: 30 segundos por request
✅ ZeroGPU H200 detectado - Plan Pro activo
🚀 Configuración optimizada para H200

🚀 Optimizaciones Implementadas

1. Configuración H200

  • torch.float16 para mayor velocidad
  • 🔧 Optimizaciones CUDA habilitadas
  • 🎯 Configuración específica para H200

2. Timeouts Optimizados

  • 🎨 Imágenes: 30 segundos
  • 🎬 Videos: 60 segundos
  • ⚡ Modelos turbo: 15 segundos

3. Parámetros Optimizados

  • SDXL Turbo: 1 paso, guidance=0.0
  • SD Turbo: 2 pasos, guidance≤1.0
  • Modelos estándar: 15 pasos máximo

📈 Beneficios del Plan Pro

Característica Plan Gratuito Plan Pro
GPU T4 H200
Memoria 16GB 69.5GB
Tiempo diario 2 horas 25 minutos
Velocidad Estándar 3x más rápido
Estabilidad Limitada Alta

🔧 Troubleshooting

Error: "GPU task aborted"

Causa: Plan gratuito agotado Solución: Verificar plan Pro en Hugging Face

Error: "No se detectó GPU"

Causa: Space no configurado correctamente Solución: Verificar variables de entorno

Error: "Cuota agotada"

Causa: Usando plan gratuito Solución: Actualizar a plan Pro

📞 Soporte

Si persisten los problemas:

  1. Verifica el plan Pro en Hugging Face
  2. Revisa las variables de entorno del Space
  3. Ejecuta el script de verificación
  4. Contacta soporte de Hugging Face si es necesario