Buscador de palabras múltiples arreglado
Browse files- herramientas.py +9 -4
- identificador.py +5 -2
herramientas.py
CHANGED
@@ -113,21 +113,26 @@ def buscaIndexMultiplesPalabras(arreglo_textos, conceptos_requeridos):
|
|
113 |
|
114 |
# Buscamos si alguna forma (preferida o alternativa) está en la línea
|
115 |
for forma in concepto['todas_las_formas']:
|
|
|
|
|
116 |
if forma in texto_linea_lower:
|
|
|
117 |
encontrado_en_esta_linea = True
|
|
|
118 |
|
119 |
# Guardamos qué forma se encontró y cuál es la preferida
|
120 |
palabras_encontradas_en_linea[forma] = concepto['preferida']
|
121 |
|
122 |
-
|
123 |
-
#
|
124 |
-
|
|
|
125 |
print("Paso if encontrado_en_esta_linea es True...")
|
126 |
if encontrado_en_esta_linea:
|
127 |
es_coincidencia_completa = True
|
128 |
print(f"Línea {i}: Concepto '{concepto['preferida']}' : Encontrado.")
|
129 |
print("Estoy por hacer break por que es_coincidencia_completa es True...")
|
130 |
-
break #
|
131 |
|
132 |
|
133 |
print("Paso: if es_coincidencia_completa:")
|
|
|
113 |
|
114 |
# Buscamos si alguna forma (preferida o alternativa) está en la línea
|
115 |
for forma in concepto['todas_las_formas']:
|
116 |
+
print("Evaluando la siguiente forma en el concepto: Forma: ", forma)
|
117 |
+
print(f"Ahora, si la forma --{forma}-- está en la línea: --{texto_linea_lower}--, entonces: ")
|
118 |
if forma in texto_linea_lower:
|
119 |
+
print("Encontrado línea es True!")
|
120 |
encontrado_en_esta_linea = True
|
121 |
+
time.sleep(7)
|
122 |
|
123 |
# Guardamos qué forma se encontró y cuál es la preferida
|
124 |
palabras_encontradas_en_linea[forma] = concepto['preferida']
|
125 |
|
126 |
+
print("Estoy por hacer break porque encontré la línea...")
|
127 |
+
# Hemos encontrado una forma para este concepto, pasamos al siguiente concepto
|
128 |
+
break #Éste break entonces si se sale del for. De no hacerlo, volvería arriba.
|
129 |
+
|
130 |
print("Paso if encontrado_en_esta_linea es True...")
|
131 |
if encontrado_en_esta_linea:
|
132 |
es_coincidencia_completa = True
|
133 |
print(f"Línea {i}: Concepto '{concepto['preferida']}' : Encontrado.")
|
134 |
print("Estoy por hacer break por que es_coincidencia_completa es True...")
|
135 |
+
break # Se sale del for grande.
|
136 |
|
137 |
|
138 |
print("Paso: if es_coincidencia_completa:")
|
identificador.py
CHANGED
@@ -45,7 +45,10 @@ def identifica_ine(textos_extraidos_simplificados):
|
|
45 |
#Identifica si una INE es nueva o antigüa edición.
|
46 |
#Buscaré los dos campos que tienen SOLO las INE antigüas: localidad y municipio.
|
47 |
#Municipio
|
48 |
-
conceptos_busqueda = [{
|
|
|
|
|
|
|
49 |
print("Entrando a busqueda de municipio en buscar multiples palabras: ")
|
50 |
indice, textos_extraidos_corregidos = herramientas.buscaIndexMultiplesPalabras(textos_extraidos_simplificados, conceptos_busqueda)
|
51 |
print("Salí de la búsqueda...")
|
@@ -53,7 +56,7 @@ def identifica_ine(textos_extraidos_simplificados):
|
|
53 |
municipio_existe = True if indice is not None else False
|
54 |
|
55 |
print("Municipio existe: ", municipio_existe)
|
56 |
-
|
57 |
#Localidad
|
58 |
conceptos_busqueda = [{'preferida': 'localidad', 'alternativas': ['']}]
|
59 |
indice, textos_extraidos_corregidos = herramientas.buscaIndexMultiplesPalabras(textos_extraidos_simplificados, conceptos_busqueda)
|
|
|
45 |
#Identifica si una INE es nueva o antigüa edición.
|
46 |
#Buscaré los dos campos que tienen SOLO las INE antigüas: localidad y municipio.
|
47 |
#Municipio
|
48 |
+
conceptos_busqueda = [{
|
49 |
+
'preferida': 'municipio',
|
50 |
+
#'alternativas': ['']
|
51 |
+
}]
|
52 |
print("Entrando a busqueda de municipio en buscar multiples palabras: ")
|
53 |
indice, textos_extraidos_corregidos = herramientas.buscaIndexMultiplesPalabras(textos_extraidos_simplificados, conceptos_busqueda)
|
54 |
print("Salí de la búsqueda...")
|
|
|
56 |
municipio_existe = True if indice is not None else False
|
57 |
|
58 |
print("Municipio existe: ", municipio_existe)
|
59 |
+
|
60 |
#Localidad
|
61 |
conceptos_busqueda = [{'preferida': 'localidad', 'alternativas': ['']}]
|
62 |
indice, textos_extraidos_corregidos = herramientas.buscaIndexMultiplesPalabras(textos_extraidos_simplificados, conceptos_busqueda)
|