Spaces:
Sleeping
Sleeping
Commit
路
145687f
1
Parent(s):
3835ef0
Update app.py
Browse files
app.py
CHANGED
@@ -1,13 +1,11 @@
|
|
1 |
import gradio as gr
|
2 |
-
import
|
3 |
-
os.system("pip install PyMuPDF")
|
4 |
-
import fitz # PyMuPDF
|
5 |
|
6 |
def pdf_to_xml(pdf_file):
|
7 |
-
|
8 |
pdf_text = ""
|
9 |
-
for page in
|
10 |
-
pdf_text += page.
|
11 |
|
12 |
# Aqu铆 ir铆a la l贸gica para convertir el texto del PDF a XML
|
13 |
# Por ejemplo, puedes usar una librer铆a como lxml para construir un XML
|
|
|
1 |
import gradio as gr
|
2 |
+
import PyPDF2
|
|
|
|
|
3 |
|
4 |
def pdf_to_xml(pdf_file):
|
5 |
+
pdf_reader = PyPDF2.PdfReader(pdf_file.name)
|
6 |
pdf_text = ""
|
7 |
+
for page in pdf_reader.pages:
|
8 |
+
pdf_text += page.extract_text()
|
9 |
|
10 |
# Aqu铆 ir铆a la l贸gica para convertir el texto del PDF a XML
|
11 |
# Por ejemplo, puedes usar una librer铆a como lxml para construir un XML
|