fireedman commited on
Commit
17f4bd9
·
verified ·
1 Parent(s): 9d1c02d

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +44 -4
README.md CHANGED
@@ -1,10 +1,50 @@
1
  ---
2
  title: VideoAvatar
3
- emoji: 🎥
4
  colorFrom: red
5
  colorTo: pink
6
  sdk: gradio
7
- sdk_version: 5.32.1
8
  app_file: app.py
9
- pinned: false
10
- ---
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
  ---
2
  title: VideoAvatar
3
+ emoji: 🧑‍🎤
4
  colorFrom: red
5
  colorTo: pink
6
  sdk: gradio
7
+ sdk_version: 4.12.0
8
  app_file: app.py
9
+ pinned: true
10
+ ---
11
+
12
+ # 🎥 VideoAvatar - IA de Sincronización Labial con Audio Personalizado
13
+
14
+ Este proyecto permite grabar audio directamente desde el navegador, transcribirlo con modelos `Whisper`, generar una respuesta con `OpenAI GPT-4`, sintetizar voz con `gTTS` y generar un video sincronizado usando `Wav2Lip` en su versión optimizada con OpenVINO.
15
+
16
+ ## 🧠 Flujo de trabajo:
17
+
18
+ 1. Grabación de voz desde el navegador.
19
+ 2. Transcripción automática usando `openai/whisper-large`.
20
+ 3. Generación de respuesta con GPT-4 (`langchain` + `OpenAI API`).
21
+ 4. Conversión texto → voz (`gTTS`).
22
+ 5. Procesamiento final de video con sincronización labial (`Wav2Lip` + OpenVINO).
23
+
24
+ ## 🗂 Estructura
25
+
26
+ - `app.py`: punto de entrada para Spaces.
27
+ - `src/`: módulos de procesamiento.
28
+ - `assets/`: contiene videos y audios.
29
+ - `results/`: salidas del sistema (audio TTS, video final, transcripción).
30
+
31
+ ## ✅ Requisitos
32
+
33
+ Declarados en `requirements.txt`. Incluye:
34
+ - `gradio`
35
+ - `transformers`
36
+ - `torch`
37
+ - `librosa`
38
+ - `soundfile`
39
+ - `gtts`
40
+ - `openvino`
41
+ - `opencv-python-headless`
42
+ - `python-dotenv`
43
+
44
+ ## 🚧 Notas
45
+
46
+ > Este proyecto requiere que los modelos `.xml` de OpenVINO estén preconvertidos y accesibles. Si se ejecuta fuera de Hugging Face, asegúrate de usar `convert_models.py` y tener los modelos en `models/`.
47
+
48
+ ---
49
+
50
+ ¿Deseas que lo genere automáticamente en un archivo para que lo agregues al repo (`README.md`) o prefieres copiarlo tú manualmente?