import herramientas import herramientas_campos #Campos para DNI. def nombre(textos_extraidos, textos_extraidos_simplificados): indice = herramientas.buscaIndexPalabra(textos_extraidos_simplificados, 'usual') nombre = textos_extraidos[indice-2] apellido = textos_extraidos[indice-1] return nombre, apellido def identificacion(textos_extraidos, textos_extraidos_simplificados): indice = herramientas_campos.buscarPatronCedula(textos_extraidos_simplificados) identificacion = textos_extraidos[indice] return identificacion def fecha_nacimiento(textos_extraidos, textos_extraidos_limpios): conceptos_busqueda = [ {'preferida': 'fecha', 'alternativas': []}, {'preferida': 'nacimiento', 'alternativas': ['nacimento']} ] indice, textos_extraidos_corregidos = herramientas.buscaIndexMultiplesPalabras(textos_extraidos_limpios, conceptos_busqueda) #Future: Agregar validación aquí, porque si regresa None es que no encontró nada. print("Ésto es textos extraídos corregidos: ", textos_extraidos_corregidos) textos_extraidos_limpios = textos_extraidos_corregidos print("El índice de la fecha de nacimiento es: ", indice) texto_fecha_nacimiento = textos_extraidos_limpios[indice] #En ésta ocasión estoy usando el texto limpio para que el patrón lo identifique más fácilmente. print("Y su correspondiente texto es: " , texto_fecha_nacimiento) fecha_nacimiento = herramientas_campos.obtener_fecha(texto_fecha_nacimiento) return fecha_nacimiento def sexo(textos_extraidos, textos_extraidos_limpios): conceptos_busqueda = [ {'preferida': 'sexo', 'alternativas': ['sex', 'seno', 'sen']}, #{'preferida': 'sangre', 'alternativas': []} ] indice, textos_extraidos_corregidos = herramientas.buscaIndexMultiplesPalabras(textos_extraidos_limpios, conceptos_busqueda) textos_extraidos_limpios = textos_extraidos_corregidos print("El índice de genero es: ", indice) texto_genero = textos_extraidos_limpios[indice] print("Y su correspondiente texto es: " , texto_genero) sexo = herramientas_campos.obtener_genero(texto_genero) return sexo