Commit Inicial para Reconocimiento Avanzado de Documentos
Browse files- __pycache__/app.cpython-311.pyc +0 -0
- __pycache__/funciones.cpython-311.pyc +0 -0
- documentos.py +1 -0
- funciones.py +2 -0
- herramientas.py +3 -2
- obtenCampo.py +2 -1
__pycache__/app.cpython-311.pyc
CHANGED
Binary files a/__pycache__/app.cpython-311.pyc and b/__pycache__/app.cpython-311.pyc differ
|
|
__pycache__/funciones.cpython-311.pyc
CHANGED
Binary files a/__pycache__/funciones.cpython-311.pyc and b/__pycache__/funciones.cpython-311.pyc differ
|
|
documentos.py
CHANGED
@@ -1,6 +1,7 @@
|
|
1 |
import obtenCampo
|
2 |
|
3 |
async def dni(textos_extraidos):
|
|
|
4 |
textos_extraidos_simplificados = [texto.lower().replace(" ", "") for texto in textos_extraidos]
|
5 |
print("Textos extraídos simplificados:")
|
6 |
print(textos_extraidos_simplificados)
|
|
|
1 |
import obtenCampo
|
2 |
|
3 |
async def dni(textos_extraidos):
|
4 |
+
print("Iniciando búsqueda de dni.")
|
5 |
textos_extraidos_simplificados = [texto.lower().replace(" ", "") for texto in textos_extraidos]
|
6 |
print("Textos extraídos simplificados:")
|
7 |
print(textos_extraidos_simplificados)
|
funciones.py
CHANGED
@@ -5,6 +5,8 @@ import time
|
|
5 |
async def procesa_documento(image):
|
6 |
|
7 |
textos_extraidos = await herramientas.procesaImagen(image)
|
|
|
|
|
8 |
print("Textos extraídos: ")
|
9 |
print(textos_extraidos)
|
10 |
|
|
|
5 |
async def procesa_documento(image):
|
6 |
|
7 |
textos_extraidos = await herramientas.procesaImagen(image)
|
8 |
+
print("El tipo regresado por procesa imagen es: ", type(textos_extraidos))
|
9 |
+
time.sleep(1)
|
10 |
print("Textos extraídos: ")
|
11 |
print(textos_extraidos)
|
12 |
|
herramientas.py
CHANGED
@@ -15,7 +15,7 @@ async def imageToTemp(image):
|
|
15 |
return temp_file_path
|
16 |
|
17 |
except Exception as e:
|
18 |
-
print(f"Error al procesar
|
19 |
return {"error": "Error al procesar la imagen"}
|
20 |
|
21 |
|
@@ -150,6 +150,7 @@ async def procesaImagen(image):
|
|
150 |
return textos_extraidos
|
151 |
except Exception as e:
|
152 |
print(f"Error al procesar el archivo: {e}")
|
|
|
153 |
|
154 |
|
155 |
def obtener_fecha(texto):
|
@@ -204,7 +205,7 @@ def define_documento(textos_extraidos):
|
|
204 |
|
205 |
#Busqueda de DNI
|
206 |
conceptos_busqueda_dni = [
|
207 |
-
{'preferida': 'nombre', 'alternativas': []},
|
208 |
{'preferida': 'usual', 'alternativas': []}
|
209 |
]
|
210 |
|
|
|
15 |
return temp_file_path
|
16 |
|
17 |
except Exception as e:
|
18 |
+
print(f"Error al procesar la imagen: {e}")
|
19 |
return {"error": "Error al procesar la imagen"}
|
20 |
|
21 |
|
|
|
150 |
return textos_extraidos
|
151 |
except Exception as e:
|
152 |
print(f"Error al procesar el archivo: {e}")
|
153 |
+
return 'Error'
|
154 |
|
155 |
|
156 |
def obtener_fecha(texto):
|
|
|
205 |
|
206 |
#Busqueda de DNI
|
207 |
conceptos_busqueda_dni = [
|
208 |
+
{'preferida': 'nombre', 'alternativas': ['noaigre']},
|
209 |
{'preferida': 'usual', 'alternativas': []}
|
210 |
]
|
211 |
|
obtenCampo.py
CHANGED
@@ -20,7 +20,8 @@ def Fecha_Nacimiento(textos_extraidos, textos_extraidos_limpios):
|
|
20 |
{'preferida': 'nacimiento', 'alternativas': ['nacimento']} ]
|
21 |
|
22 |
indice, textos_extraidos_corregidos = herramientas.buscaIndexMultiplesPalabras_Corregida(textos_extraidos_limpios, conceptos_busqueda)
|
23 |
-
|
|
|
24 |
textos_extraidos_limpios = textos_extraidos_corregidos
|
25 |
print("El índice de la fecha de nacimiento es: ", indice)
|
26 |
texto_fecha_nacimiento = textos_extraidos_limpios[indice] #En ésta ocasión estoy usando el texto limpio para que el patrón lo identifique más fácilmente.
|
|
|
20 |
{'preferida': 'nacimiento', 'alternativas': ['nacimento']} ]
|
21 |
|
22 |
indice, textos_extraidos_corregidos = herramientas.buscaIndexMultiplesPalabras_Corregida(textos_extraidos_limpios, conceptos_busqueda)
|
23 |
+
#Future: Agregar validación aquí, porque si regresa None es que no encontró nada.
|
24 |
+
print("Ésto es textos extraídos corregidos: ", textos_extraidos_corregidos)
|
25 |
textos_extraidos_limpios = textos_extraidos_corregidos
|
26 |
print("El índice de la fecha de nacimiento es: ", indice)
|
27 |
texto_fecha_nacimiento = textos_extraidos_limpios[indice] #En ésta ocasión estoy usando el texto limpio para que el patrón lo identifique más fácilmente.
|