tomaseo2022 commited on
Commit
ec6a130
1 Parent(s): dd1be31

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +5 -5
app.py CHANGED
@@ -1,11 +1,11 @@
1
  import gradio as gr
2
- import PyPDF2
3
 
4
  def pdf_to_xml(pdf_file):
5
- pdf_reader = PyPDF2.PdfReader(pdf_file.name)
6
- pdf_text = ""
7
- for page in pdf_reader.pages:
8
- pdf_text += page.extract_text()
9
 
10
  # Aqu铆 ir铆a la l贸gica para convertir el texto del PDF a XML
11
  # Por ejemplo, puedes usar una librer铆a como lxml para construir un XML
 
1
  import gradio as gr
2
+ import pdfplumber
3
 
4
  def pdf_to_xml(pdf_file):
5
+ with pdfplumber.open(pdf_file.name) as pdf:
6
+ pdf_text = ""
7
+ for page in pdf.pages:
8
+ pdf_text += page.extract_text()
9
 
10
  # Aqu铆 ir铆a la l贸gica para convertir el texto del PDF a XML
11
  # Por ejemplo, puedes usar una librer铆a como lxml para construir un XML