Spaces:
Sleeping
Sleeping
import gradio as gr | |
import pdfplumber | |
def pdf_to_xml(pdf_file): | |
with pdfplumber.open(pdf_file.name) as pdf: | |
pdf_text = "" | |
for page in pdf.pages: | |
pdf_text += page.extract_text() | |
# Aquí iría la lógica para convertir el texto del PDF a XML | |
# Por ejemplo, puedes usar una librería como lxml para construir un XML | |
# Por ahora, simplemente devolveré el texto del PDF | |
return pdf_text | |
iface = gr.Interface( | |
fn=pdf_to_xml, | |
inputs=gr.inputs.File(label="Selecciona un archivo PDF", type="file"), | |
outputs=gr.outputs.Textbox(label="Archivo XML convertido") | |
) | |
iface.launch(share=True) | |