Spaces:
Sleeping
Sleeping
Commit
路
2b56592
1
Parent(s):
464c3d2
Update app.py
Browse files
app.py
CHANGED
@@ -1,12 +1,11 @@
|
|
1 |
import gradio as gr
|
2 |
-
|
3 |
-
import PyPDF2
|
4 |
|
5 |
def pdf_to_xml(pdf_file):
|
6 |
-
|
7 |
pdf_text = ""
|
8 |
-
for page in
|
9 |
-
pdf_text += page.
|
10 |
|
11 |
# Aqu铆 ir铆a la l贸gica para convertir el texto del PDF a XML
|
12 |
# Por ejemplo, puedes usar una librer铆a como lxml para construir un XML
|
@@ -21,3 +20,4 @@ iface = gr.Interface(
|
|
21 |
)
|
22 |
|
23 |
iface.launch(share=True)
|
|
|
|
1 |
import gradio as gr
|
2 |
+
import fitz # PyMuPDF
|
|
|
3 |
|
4 |
def pdf_to_xml(pdf_file):
|
5 |
+
pdf_document = fitz.open(pdf_file.name)
|
6 |
pdf_text = ""
|
7 |
+
for page in pdf_document:
|
8 |
+
pdf_text += page.get_text()
|
9 |
|
10 |
# Aqu铆 ir铆a la l贸gica para convertir el texto del PDF a XML
|
11 |
# Por ejemplo, puedes usar una librer铆a como lxml para construir un XML
|
|
|
20 |
)
|
21 |
|
22 |
iface.launch(share=True)
|
23 |
+
|