HF Vector Pipeline
Pipeline end‑to‑end para convertir documentos (.md
, .docx
, .pdf
)
en un JSONL con embeddings y metadatos, listo para cargar en
Amazon S3 Vector Features.
Incluye:
- CLI (
python -m src.preprocess …
) - UI Gradio (archivo app.py) preparada para HuggingFace Spaces
- Soporte para Windows 11 + VSCode