rad

Running

Moibe commited on 2 days ago

Commit

93a5ed3

1 Parent(s): 2e0d094

Facilitador de procesamiento de nuevos documentos

Files changed (6) hide show

app.py CHANGED Viewed

@@ -29,6 +29,15 @@ async def echo_image(image: UploadFile = File(...)):
     contents = await image.read()
     return StreamingResponse(BytesIO(contents), media_type=image.content_type)
 @app.post(
         "/procesa_documento/",
         tags=["Documentos"],

     contents = await image.read()
     return StreamingResponse(BytesIO(contents), media_type=image.content_type)
+@app.post(
+        "/identifica_documento/",
+        tags=["Documentos"],
+        summary="Reconocimiento Avanzado de Documentos")
+async def procesa_documento(image: UploadFile = File(...)):
+    if not image.content_type.startswith("image/"):
+        return {"error": "El archivo no es una imagen"}
+    return await funciones.identifica_documento(image)
 @app.post(
         "/procesa_documento/",
         tags=["Documentos"],

conceptos_busqueda.py CHANGED Viewed

@@ -10,5 +10,5 @@ pasaporte = [
 ine = [
         {'preferida': 'Instituto Nacional Electoral', 'alternativas': ['']},
-        #{'preferida': 'identidad', 'alternativas': []}
         ]

 ine = [
         {'preferida': 'Instituto Nacional Electoral', 'alternativas': ['']},
+        {'preferida': 'México', 'alternativas': []}
         ]

funciones.py CHANGED Viewed

@@ -2,17 +2,20 @@ import documentos
 import herramientas
 import identificador
-async def procesa_documento(image):
-	print("Procesando imagen...")
 	textos_extraidos = await herramientas.procesaImagen(image)
-	print("Textos extraídos: ")
-	print(textos_extraidos)
-	#Simplifica los textos extraidos:
 	textos_extraidos_simplificados = herramientas.simplificaTextos(textos_extraidos)
 	documento = identificador.identifica_documento(textos_extraidos_simplificados)
-	print("El documento es: ", documento)
 	if documento == 'dni':
 		# Llama a la función 'dni' si el documento es un DNI

 import herramientas
 import identificador
+async def identifica_documento(image):
 	textos_extraidos = await herramientas.procesaImagen(image)
+	textos_extraidos_simplificados = herramientas.simplificaTextos(textos_extraidos)
+	documento = identificador.identifica_documento(textos_extraidos_simplificados)
+	return {
+		"documento": documento
+	}
+async def procesa_documento(image):
+	textos_extraidos = await herramientas.procesaImagen(image)
 	textos_extraidos_simplificados = herramientas.simplificaTextos(textos_extraidos)
 	documento = identificador.identifica_documento(textos_extraidos_simplificados)
 	if documento == 'dni':
 		# Llama a la función 'dni' si el documento es un DNI

herramientas.py CHANGED Viewed

@@ -47,7 +47,7 @@ def buscaIndexPalabra(arreglo, palabra):
             return i
     return None # Cambiado de 'error' a None
-def buscaIndexMultiplesPalabras_Corregida(arreglo_textos, conceptos_requeridos):
     """
     Busca el índice de la primera línea que contiene todas las palabras requeridas (o sus alternativas)
     y devuelve la línea con las alternativas corregidas a su forma preferida.

             return i
     return None # Cambiado de 'error' a None
+def buscaIndexMultiplesPalabras(arreglo_textos, conceptos_requeridos):
     """
     Busca el índice de la primera línea que contiene todas las palabras requeridas (o sus alternativas)
     y devuelve la línea con las alternativas corregidas a su forma preferida.

identificador.py CHANGED Viewed

@@ -21,7 +21,7 @@ def identifica_documento(textos_extraidos_simplificados):
         conceptos_actuales = getattr(conceptos_busqueda, tipo_documento)
         # Llama a la función de búsqueda para el tipo de documento actual
-        indice, textos_corregidos = herramientas.buscaIndexMultiplesPalabras_Corregida(
             textos_extraidos_simplificados,
             conceptos_actuales
         )

         conceptos_actuales = getattr(conceptos_busqueda, tipo_documento)
         # Llama a la función de búsqueda para el tipo de documento actual
+        indice, textos_corregidos = herramientas.buscaIndexMultiplesPalabras(
             textos_extraidos_simplificados,
             conceptos_actuales
         )

obtenCampo.py CHANGED Viewed

@@ -19,7 +19,7 @@ def Fecha_Nacimiento(textos_extraidos, textos_extraidos_limpios):
     {'preferida': 'fecha', 'alternativas': []},
     {'preferida': 'nacimiento', 'alternativas': ['nacimento']}    ]
-    indice, textos_extraidos_corregidos = herramientas.buscaIndexMultiplesPalabras_Corregida(textos_extraidos_limpios, conceptos_busqueda)
     #Future: Agregar validación aquí, porque si regresa None es que no encontró nada.
     print("Ésto es textos extraídos corregidos: ", textos_extraidos_corregidos)
     textos_extraidos_limpios = textos_extraidos_corregidos
@@ -36,7 +36,7 @@ def Sexo(textos_extraidos, textos_extraidos_limpios):
     #{'preferida': 'sangre', 'alternativas': []}
     ]
-    indice, textos_extraidos_corregidos = herramientas.buscaIndexMultiplesPalabras_Corregida(textos_extraidos_limpios, conceptos_busqueda)
     textos_extraidos_limpios = textos_extraidos_corregidos
     print("El índice de genero es: ", indice)

     {'preferida': 'fecha', 'alternativas': []},
     {'preferida': 'nacimiento', 'alternativas': ['nacimento']}    ]
+    indice, textos_extraidos_corregidos = herramientas.buscaIndexMultiplesPalabras(textos_extraidos_limpios, conceptos_busqueda)
     #Future: Agregar validación aquí, porque si regresa None es que no encontró nada.
     print("Ésto es textos extraídos corregidos: ", textos_extraidos_corregidos)
     textos_extraidos_limpios = textos_extraidos_corregidos
     #{'preferida': 'sangre', 'alternativas': []}
     ]
+    indice, textos_extraidos_corregidos = herramientas.buscaIndexMultiplesPalabras(textos_extraidos_limpios, conceptos_busqueda)
     textos_extraidos_limpios = textos_extraidos_corregidos
     print("El índice de genero es: ", indice)