|
import herramientas |
|
import conceptos_busqueda |
|
import time |
|
|
|
def identifica_documento(textos_extraidos_simplificados): |
|
""" |
|
Busca el tipo de documento en el texto, probando con una lista de documentos. |
|
|
|
Args: |
|
textos_extraidos_simplificados (list): Lista de strings con el texto a analizar. |
|
|
|
Returns: |
|
str: El nombre del primer documento encontrado ('dni', 'pasaporte', etc.), |
|
o None si ninguno de los documentos fue identificado. |
|
""" |
|
print("Estoy en identifica documento...") |
|
documentos = ['ine', 'dni', 'pasaporte'] |
|
|
|
for tipo_documento in documentos: |
|
print("Revisando tipo de documento: ", tipo_documento) |
|
|
|
|
|
|
|
conceptos_actuales = getattr(conceptos_busqueda, tipo_documento) |
|
|
|
|
|
indice, textos_corregidos = herramientas.buscaIndexMultiplesPalabras( |
|
textos_extraidos_simplificados, |
|
conceptos_actuales |
|
) |
|
|
|
|
|
|
|
if indice is not None: |
|
|
|
|
|
|
|
|
|
return tipo_documento |
|
|
|
|
|
return None |
|
|
|
def identifica_ine(textos_extraidos_simplificados): |
|
|
|
|
|
|
|
conceptos_busqueda = [{ |
|
'preferida': 'municipio', |
|
|
|
}] |
|
print("Entrando a busqueda de municipio en buscar multiples palabras: ") |
|
indice, textos_extraidos_corregidos = herramientas.buscaIndexMultiplesPalabras(textos_extraidos_simplificados, conceptos_busqueda) |
|
print("Salí de la búsqueda...") |
|
|
|
municipio_existe = True if indice is not None else False |
|
|
|
print("Municipio existe: ", municipio_existe) |
|
|
|
|
|
conceptos_busqueda = [{'preferida': 'localidad', 'alternativas': ['']}] |
|
indice, textos_extraidos_corregidos = herramientas.buscaIndexMultiplesPalabras(textos_extraidos_simplificados, conceptos_busqueda) |
|
localidad_existe = True if indice is not None else False |
|
|
|
print("Localidad existe: ", localidad_existe) |
|
|
|
if municipio_existe and localidad_existe: |
|
tipo_ine = 'ine_antes' |
|
else: |
|
tipo_ine = 'ine_actual' |
|
|
|
print("INE detectada es: ", tipo_ine) |
|
|
|
return tipo_ine |