|
import herramientas |
|
import conceptos_busqueda |
|
|
|
def identifica_documento(textos_extraidos_simplificados): |
|
""" |
|
Busca el tipo de documento en el texto, probando con una lista de documentos. |
|
|
|
Args: |
|
textos_extraidos_simplificados (list): Lista de strings con el texto a analizar. |
|
|
|
Returns: |
|
str: El nombre del primer documento encontrado ('dni', 'pasaporte', etc.), |
|
o None si ninguno de los documentos fue identificado. |
|
""" |
|
print("Estoy en identifica documento...") |
|
documentos = ['ine', 'dni', 'pasaporte'] |
|
|
|
for tipo_documento in documentos: |
|
print("Revisando tipo de documento: ", tipo_documento) |
|
|
|
|
|
|
|
conceptos_actuales = getattr(conceptos_busqueda, tipo_documento) |
|
print("Conceptos_Actuales usados: ", conceptos_actuales) |
|
|
|
|
|
indice, textos_corregidos = herramientas.buscaIndexMultiplesPalabras( |
|
textos_extraidos_simplificados, |
|
conceptos_actuales |
|
) |
|
|
|
|
|
|
|
if indice is not None: |
|
|
|
|
|
|
|
|
|
return tipo_documento |
|
|
|
|
|
return None |
|
|
|
def identifica_ine(textos_extraidos_simplificados): |
|
|
|
|
|
|
|
conceptos_busqueda = [{'preferida': 'municipio', 'alternativas': ['']}] |
|
indice, textos_extraidos_corregidos = herramientas.buscaIndexMultiplesPalabras(textos_extraidos_simplificados, conceptos_busqueda) |
|
municipio_existe = True if indice is not None else False |
|
|
|
|
|
conceptos_busqueda = [{'preferida': 'localidad', 'alternativas': ['']}] |
|
indice, textos_extraidos_corregidos = herramientas.buscaIndexMultiplesPalabras(textos_extraidos_simplificados, conceptos_busqueda) |
|
localidad_existe = True if indice is not None else False |
|
|
|
if municipio_existe and localidad_existe: |
|
tipo_ine = 'ine_antes' |
|
else: |
|
tipo_ine = 'ine_actual' |
|
|
|
return tipo_ine |