Ideal_Client

Sleeping

App Files Files Community

JeCabrera commited on Mar 12

Commit

e665408

verified ·

1 Parent(s): d6d8e75

Update app.py

Browse files

Files changed (1) hide show

app.py +47 -8

app.py CHANGED Viewed

@@ -191,15 +191,54 @@ with col2:
                     st.session_state.formato
                 )
-                # Limpiar el perfil si contiene datos de formato raw
                 if isinstance(perfil_cliente, str):
-                    # Eliminar cualquier diccionario o estructura JSON que pueda estar en el texto
-                    if perfil_cliente.strip().startswith('{') and '}' in perfil_cliente:
-                        import re
-                        # Buscar el contenido real después del diccionario
-                        match = re.search(r'}\s*(.*)', perfil_cliente, re.DOTALL)
-                        if match:
-                            perfil_cliente = match.group(1).strip()
                 # Guardar en session_state
                 st.session_state.perfil_cliente = perfil_cliente

                     st.session_state.formato
                 )
+                # Mejorar la limpieza del perfil para eliminar estructuras JSON/diccionario
                 if isinstance(perfil_cliente, str):
+                    import re
+                    import json
+                    # Intentar detectar y limpiar formato JSON
+                    if '{' in perfil_cliente and '}' in perfil_cliente:
+                        # Intentar extraer solo el contenido textual, eliminando estructuras JSON
+                        # Primero, intentar encontrar el JSON completo
+                        json_pattern = r'(\{.*?\})'
+                        json_matches = re.findall(json_pattern, perfil_cliente, re.DOTALL)
+                        if json_matches:
+                            for json_match in json_matches:
+                                # Intentar extraer el contenido real del JSON
+                                try:
+                                    # Reemplazar el JSON con una cadena vacía
+                                    perfil_cliente = perfil_cliente.replace(json_match, '')
+                                except:
+                                    pass
+                        # Limpiar líneas que parecen ser parte de un diccionario
+                        lines = perfil_cliente.split('\n')
+                        cleaned_lines = []
+                        for line in lines:
+                            # Omitir líneas que parecen ser claves de diccionario
+                            if not re.match(r'^\s*["\']?[a-zA-Z_]+["\']?\s*:', line):
+                                cleaned_lines.append(line)
+                        perfil_cliente = '\n'.join(cleaned_lines)
+                        # Eliminar llaves sueltas y corchetes
+                        perfil_cliente = re.sub(r'[{}[\]]', '', perfil_cliente)
+                        # Eliminar comillas y dos puntos que parecen ser de un diccionario
+                        perfil_cliente = re.sub(r'["\']\s*:\s*["\']', '', perfil_cliente)
+                        # Eliminar "template", "description", "example" y otras palabras clave comunes en el formato
+                        keywords = ["template", "description", "example", "Nivel de conciencia"]
+                        for keyword in keywords:
+                            perfil_cliente = re.sub(rf'["\']?{keyword}["\']?\s*:\s*["\']?', '', perfil_cliente)
+                        # Eliminar comillas sueltas
+                        perfil_cliente = re.sub(r'^\s*["\']|["\']$', '', perfil_cliente)
+                        # Eliminar espacios en blanco adicionales
+                        perfil_cliente = re.sub(r'\n\s*\n', '\n\n', perfil_cliente)
+                        perfil_cliente = perfil_cliente.strip()
                 # Guardar en session_state
                 st.session_state.perfil_cliente = perfil_cliente