Spaces:

Ntdeseb
/

ntia

Running

App Files Files Community

ntia / RESUMEN_CORRECCIONES.md

Ntdeseb

Agregar funcionalidad de gráficos vectoriales SVG con SVGDreamer y modelos Microsoft

8d8ad99 about 1 month ago

preview code

raw

history blame contribute delete

4.55 kB

A newer version of the Gradio SDK is available: 5.47.2

Upgrade

📋 Resumen de Correcciones - NTIA Space

🎯 Problema Principal Identificado

El Space NTIA estaba usando el plan gratuito de ZeroGPU (gpu.t4.micro) en lugar del plan Pro (gpu.h200.micro), causando:

❌ Errores "GPU task aborted"
❌ Límites de cuota de invitado
❌ No acceso a H200 con 25 minutos/día

✅ Correcciones Implementadas

1. Decoradores ZeroGPU Corregidos

Antes:

@spaces.GPU(compute_unit="gpu.t4.micro", timeout=30)
@spaces.GPU(compute_unit="gpu.t4.micro", timeout=60)

Después:

@spaces.GPU(compute_unit="gpu.h200.micro", timeout=30)  # Plan Pro: H200 con 25 minutos/día
@spaces.GPU(compute_unit="gpu.h200.micro", timeout=60)  # Plan Pro: H200 con 25 minutos/día

2. Configuración de Verificación de Plan Pro

Agregado al inicio del app.py:

# Configuración específica para ZeroGPU Plan Pro
print("🔧 Configurando ZeroGPU Plan Pro...")
print("📊 Plan Pro: H200 con 25 minutos/día")
print("🎯 Compute Unit: gpu.h200.micro")
print("⏱️ Timeout: 30 segundos por request")

# Verificar que estamos usando el plan Pro correcto
if torch.cuda.is_available():
    gpu_name = torch.cuda.get_device_name(0)
    if "H200" in gpu_name:
        print("✅ ZeroGPU H200 detectado - Plan Pro activo")
        print("🚀 Configuración optimizada para H200")
    else:
        print(f"⚠️ GPU detectada: {gpu_name}")
        print("💡 Considera actualizar al plan Pro para mejor rendimiento")
else:
    print("❌ No se detectó GPU - ejecutando en CPU")

3. Funciones de Verificación Agregadas

def check_auth():
    """Verificar si el usuario está autenticado con HF_TOKEN"""
    
def check_quota():
    """Verificar el estado de la cuota de ZeroGPU"""
    
def get_space_status():
    """Obtener estado completo del Space"""

4. Tab de Estado del Space

Agregado nuevo tab para verificar el estado:

# Tab de Estado del Space
with gr.TabItem("🔍 Estado del Space"):
    # Interfaz para verificar autenticación y cuota

📊 Comparación de Planes

Característica	Plan Gratuito (T4)	Plan Pro (H200)
GPU	NVIDIA T4	NVIDIA H200
Memoria	16GB	69.5GB
Tiempo diario	2 horas	25 minutos
Velocidad	Estándar	3x más rápido
Estabilidad	Limitada	Alta
Compute Unit	`gpu.t4.micro`	`gpu.h200.micro`

🔧 Configuración Requerida en Hugging Face

Variables de Entorno del Space:

HF_TOKEN=tu_token_aqui
SPACES_GPU_TIMEOUT=30
SPACES_GPU_MEMORY=8

Plan Pro Activo:

Verificar en Settings → Billing
ZeroGPU Plan Pro debe estar activo
25 minutos/día disponibles

🚀 Optimizaciones Implementadas

1. Configuración H200

⚡ torch.float16 para mayor velocidad
🔧 Optimizaciones CUDA habilitadas
🎯 Configuración específica para H200

2. Timeouts Optimizados

🎨 Imágenes: 30 segundos
🎬 Videos: 60 segundos
⚡ Modelos turbo: 15 segundos

3. Parámetros Optimizados

SDXL Turbo: 1 paso, guidance=0.0
SD Turbo: 2 pasos, guidance≤1.0
Modelos estándar: 15 pasos máximo

📁 Archivos Modificados

app.py - Decoradores y configuración principal
check_zero_gpu_config.py - Script de verificación
CONFIGURACION_ZEROGPU_PRO.md - Documentación de configuración
RESUMEN_CORRECCIONES.md - Este resumen

🔍 Verificación

Script de Verificación:

python check_zero_gpu_config.py

Logs Esperados:

🔧 Configurando ZeroGPU Plan Pro...
📊 Plan Pro: H200 con 25 minutos/día
🎯 Compute Unit: gpu.h200.micro
⏱️ Timeout: 30 segundos por request
✅ ZeroGPU H200 detectado - Plan Pro activo
🚀 Configuración optimizada para H200

⚠️ Próximos Pasos

Verificar Plan Pro en Hugging Face
Configurar variables de entorno del Space
Desplegar cambios al Space
Probar generación de imágenes/videos
Verificar logs del Space

📞 Troubleshooting

Error: "GPU task aborted"

Verificar plan Pro en Hugging Face
Confirmar variables de entorno del Space

Error: "Cuota agotada"

Verificar tiempo restante del plan Pro
Esperar reinicio diario de cuota

Error: "No se detectó GPU"

Verificar configuración del Space
Contactar soporte de Hugging Face

Estado: ✅ Correcciones implementadas Próximo paso: Desplegar al Space y verificar funcionamiento