tomaseo2022 commited on
Commit
145687f
1 Parent(s): 3835ef0

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +4 -6
app.py CHANGED
@@ -1,13 +1,11 @@
1
  import gradio as gr
2
- import os
3
- os.system("pip install PyMuPDF")
4
- import fitz # PyMuPDF
5
 
6
  def pdf_to_xml(pdf_file):
7
- pdf_document = fitz.open(pdf_file.name)
8
  pdf_text = ""
9
- for page in pdf_document:
10
- pdf_text += page.get_text()
11
 
12
  # Aqu铆 ir铆a la l贸gica para convertir el texto del PDF a XML
13
  # Por ejemplo, puedes usar una librer铆a como lxml para construir un XML
 
1
  import gradio as gr
2
+ import PyPDF2
 
 
3
 
4
  def pdf_to_xml(pdf_file):
5
+ pdf_reader = PyPDF2.PdfReader(pdf_file.name)
6
  pdf_text = ""
7
+ for page in pdf_reader.pages:
8
+ pdf_text += page.extract_text()
9
 
10
  # Aqu铆 ir铆a la l贸gica para convertir el texto del PDF a XML
11
  # Por ejemplo, puedes usar una librer铆a como lxml para construir un XML