Spaces:
Sleeping
Sleeping
Commit
路
ec6a130
1
Parent(s):
dd1be31
Update app.py
Browse files
app.py
CHANGED
@@ -1,11 +1,11 @@
|
|
1 |
import gradio as gr
|
2 |
-
import
|
3 |
|
4 |
def pdf_to_xml(pdf_file):
|
5 |
-
|
6 |
-
|
7 |
-
|
8 |
-
|
9 |
|
10 |
# Aqu铆 ir铆a la l贸gica para convertir el texto del PDF a XML
|
11 |
# Por ejemplo, puedes usar una librer铆a como lxml para construir un XML
|
|
|
1 |
import gradio as gr
|
2 |
+
import pdfplumber
|
3 |
|
4 |
def pdf_to_xml(pdf_file):
|
5 |
+
with pdfplumber.open(pdf_file.name) as pdf:
|
6 |
+
pdf_text = ""
|
7 |
+
for page in pdf.pages:
|
8 |
+
pdf_text += page.extract_text()
|
9 |
|
10 |
# Aqu铆 ir铆a la l贸gica para convertir el texto del PDF a XML
|
11 |
# Por ejemplo, puedes usar una librer铆a como lxml para construir un XML
|