tomaseo2022 commited on
Commit
2b56592
1 Parent(s): 464c3d2

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +5 -5
app.py CHANGED
@@ -1,12 +1,11 @@
1
  import gradio as gr
2
- from io import BytesIO
3
- import PyPDF2
4
 
5
  def pdf_to_xml(pdf_file):
6
- pdf_reader = PyPDF2.PdfReader(pdf_file)
7
  pdf_text = ""
8
- for page in pdf_reader.pages:
9
- pdf_text += page.extract_text()
10
 
11
  # Aqu铆 ir铆a la l贸gica para convertir el texto del PDF a XML
12
  # Por ejemplo, puedes usar una librer铆a como lxml para construir un XML
@@ -21,3 +20,4 @@ iface = gr.Interface(
21
  )
22
 
23
  iface.launch(share=True)
 
 
1
  import gradio as gr
2
+ import fitz # PyMuPDF
 
3
 
4
  def pdf_to_xml(pdf_file):
5
+ pdf_document = fitz.open(pdf_file.name)
6
  pdf_text = ""
7
+ for page in pdf_document:
8
+ pdf_text += page.get_text()
9
 
10
  # Aqu铆 ir铆a la l贸gica para convertir el texto del PDF a XML
11
  # Por ejemplo, puedes usar una librer铆a como lxml para construir un XML
 
20
  )
21
 
22
  iface.launch(share=True)
23
+