File size: 354 Bytes
dd58f3d
1670a80
dd58f3d
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
# HF Vector Pipeline

Pipeline end‑to‑end para convertir documentos (`.md`, `.docx`, `.pdf`)
en un **JSONL con embeddings** y metadatos, listo para cargar en
**Amazon S3 Vector Features**.

Incluye:

* CLI (`python -m src.preprocess …`)
* UI Gradio (archivo **app.py**) preparada para HuggingFace Spaces
* Soporte para Windows 11 + VSCode