rad

Running

App Files Files Community

Moibe commited on 2 days ago

Commit

2e0d094

1 Parent(s): 5b91cf1

Identificador General de Documentos

Browse files

Files changed (4) hide show

conceptos_busqueda.py +14 -0
funciones.py +7 -6
herramientas.py +11 -36
identificador.py +39 -0

conceptos_busqueda.py ADDED Viewed

	@@ -0,0 +1,14 @@

+dni = [
+    {'preferida': 'nombre', 'alternativas': ['noaigre']},
+    {'preferida': 'usual', 'alternativas': []}
+    ]
+pasaporte = [
+        {'preferida': 'pasaporte', 'alternativas': ['passport']},
+        #{'preferida': 'identidad', 'alternativas': []}
+        ]
+ine = [
+        {'preferida': 'Instituto Nacional Electoral', 'alternativas': ['']},
+        #{'preferida': 'identidad', 'alternativas': []}
+        ]

funciones.py CHANGED Viewed

@@ -1,17 +1,18 @@
-import herramientas
 import documentos
-import time
 async def procesa_documento(image):
 	textos_extraidos = await herramientas.procesaImagen(image)
-	print("El tipo regresado por procesa imagen es: ", type(textos_extraidos))
-	time.sleep(1)
 	print("Textos extraídos: ")
 	print(textos_extraidos)
-	documento = herramientas.define_documento(textos_extraidos)
-	print("El documento fue: ", documento)
 	if documento == 'dni':
 		# Llama a la función 'dni' si el documento es un DNI

 import documentos
+import herramientas
+import identificador
 async def procesa_documento(image):
+	print("Procesando imagen...")
 	textos_extraidos = await herramientas.procesaImagen(image)
 	print("Textos extraídos: ")
 	print(textos_extraidos)
+	#Simplifica los textos extraidos:
+	textos_extraidos_simplificados = herramientas.simplificaTextos(textos_extraidos)
+	documento = identificador.identifica_documento(textos_extraidos_simplificados)
+	print("El documento es: ", documento)
 	if documento == 'dni':
 		# Llama a la función 'dni' si el documento es un DNI

herramientas.py CHANGED Viewed

@@ -32,6 +32,12 @@ def listaTextosExtraidos(dict_recibido):
         textos_extraidos.append(texto)
     return textos_extraidos
 #Herramientas para DNI Panamá.
 def buscaIndexPalabra(arreglo, palabra):
@@ -41,7 +47,7 @@ def buscaIndexPalabra(arreglo, palabra):
             return i
     return None # Cambiado de 'error' a None
-def buscaIndexMultiplesPalabras_Corregida(arreglo, conceptos_requeridos):
     """
     Busca el índice de la primera línea que contiene todas las palabras requeridas (o sus alternativas)
     y devuelve la línea con las alternativas corregidas a su forma preferida.
@@ -71,7 +77,7 @@ def buscaIndexMultiplesPalabras_Corregida(arreglo, conceptos_requeridos):
             'alternativas': alternativas  # Solo las alternativas para saber cuáles corregir
         })
-    for i, texto_linea in enumerate(arreglo):
         texto_linea_lower = texto_linea.lower()
         # Variables para seguir el rastro de la línea actual
@@ -120,8 +126,8 @@ def buscaIndexMultiplesPalabras_Corregida(arreglo, conceptos_requeridos):
             print(f"Línea corregida: '{linea_corregida}'")
             # Ahora corregimos la línea original usando la información de las palabras encontradas
-            arreglo[i] = linea_corregida
-            return i, arreglo
     print(f"\n--- Búsqueda finalizada ---")
     print("Ninguna línea contiene todas las palabras requeridas.")
@@ -196,35 +202,4 @@ def obtener_sexo(texto):
         # que es la letra del sexo/seno. match.group(1) sería "Sexo" o "Seno".
         return match.group(2)
     else:
-        return None
-def define_documento(textos_extraidos):
-    #Definiré si el documento subido es un pasaporte o un dni.
-    textos_extraidos_simplificados = [texto.lower().replace(" ", "") for texto in textos_extraidos]
-    #Busqueda de DNI
-    conceptos_busqueda_dni = [
-    {'preferida': 'nombre', 'alternativas': ['noaigre']},
-    {'preferida': 'usual', 'alternativas': []}
-    ]
-    indice, textos_extraidos_corregidos = buscaIndexMultiplesPalabras_Corregida(textos_extraidos_simplificados, conceptos_busqueda_dni)
-    if indice is not None:
-        print("Si es dni...")
-        return 'dni'
-    else:
-        #Revisar si es pasaporte.
-        #Busqueda de DNI
-        conceptos_busqueda_pasaporte = [
-        {'preferida': 'pasaporte', 'alternativas': ['passport']},
-        #{'preferida': 'identidad', 'alternativas': []}
-        ]
-        indice, textos_extraidos_corregidos = buscaIndexMultiplesPalabras_Corregida(textos_extraidos_simplificados, conceptos_busqueda_pasaporte)
-        if indice is not None:
-            print("Si es pasaporte...")
-            return 'pasaporte'
-        else:
-            print("No es pasaporte ni dni.")
-            return None

         textos_extraidos.append(texto)
     return textos_extraidos
+def simplificaTextos(textos_extraidos):
+    textos_extraidos_simplificados = [texto.lower().replace(" ", "") for texto in textos_extraidos]
+    print("Textos extraídos simplificados:")
+    print(textos_extraidos_simplificados)
+    return textos_extraidos_simplificados
 #Herramientas para DNI Panamá.
 def buscaIndexPalabra(arreglo, palabra):
             return i
     return None # Cambiado de 'error' a None
+def buscaIndexMultiplesPalabras_Corregida(arreglo_textos, conceptos_requeridos):
     """
     Busca el índice de la primera línea que contiene todas las palabras requeridas (o sus alternativas)
     y devuelve la línea con las alternativas corregidas a su forma preferida.
             'alternativas': alternativas  # Solo las alternativas para saber cuáles corregir
         })
+    for i, texto_linea in enumerate(arreglo_textos):
         texto_linea_lower = texto_linea.lower()
         # Variables para seguir el rastro de la línea actual
             print(f"Línea corregida: '{linea_corregida}'")
             # Ahora corregimos la línea original usando la información de las palabras encontradas
+            arreglo_textos[i] = linea_corregida
+            return i, arreglo_textos
     print(f"\n--- Búsqueda finalizada ---")
     print("Ninguna línea contiene todas las palabras requeridas.")
         # que es la letra del sexo/seno. match.group(1) sería "Sexo" o "Seno".
         return match.group(2)
     else:
+        return None

identificador.py ADDED Viewed

	@@ -0,0 +1,39 @@

+import herramientas
+import conceptos_busqueda
+def identifica_documento(textos_extraidos_simplificados):
+    """
+    Busca el tipo de documento en el texto, probando con una lista de documentos.
+    Args:
+        textos_extraidos_simplificados (list): Lista de strings con el texto a analizar.
+    Returns:
+        str: El nombre del primer documento encontrado ('dni', 'pasaporte', etc.),
+             o None si ninguno de los documentos fue identificado.
+    """
+    documentos = ['ine', 'dni', 'pasaporte']
+    for tipo_documento in documentos:
+        # Usamos 'getattr' para acceder dinámicamente al atributo correcto
+        # del objeto 'conceptos_busqueda', como 'conceptos_busqueda.dni'.
+        conceptos_actuales = getattr(conceptos_busqueda, tipo_documento)
+        # Llama a la función de búsqueda para el tipo de documento actual
+        indice, textos_corregidos = herramientas.buscaIndexMultiplesPalabras_Corregida(
+            textos_extraidos_simplificados,
+            conceptos_actuales
+        )
+        # Si la búsqueda encuentra un resultado, salimos inmediatamente y retornamos
+        # el nombre del documento.
+        if indice is not None:
+            # Puedes retornar el tipo_documento y los textos corregidos
+            # return tipo_documento, textos_corregidos
+            # O simplemente el tipo de documento, como en tu ejemplo
+            return tipo_documento
+    # Si el bucle termina sin encontrar ningún documento, retornamos None
+    return None