Spaces:

Rulga
/

status-law-gbot

Running

App Files Files Community

Rulga commited on Mar 25

Commit

0f93e9d

1 Parent(s): 60cfc29

Initialize project structure and add configuration for knowledge base and document loading

Browse files

Files changed (13) hide show

README.md +33 -1
app.py +135 -38
config/__init__.py +1 -0
config/constants.py +49 -0
config/settings.py +13 -0
requirements.txt +12 -1
src/__init__.py +1 -0
src/interface/__init__.py +1 -0
src/knowledge_base/__init__.py +1 -0
src/knowledge_base/loader.py +28 -0
src/knowledge_base/vector_store.py +59 -0
src/models/__init__.py +1 -0
utils/__init__.py +1 -0

README.md CHANGED Viewed

@@ -9,4 +9,36 @@ app_file: app.py
 pinned: false
 ---
-An example chatbot using [Gradio](https://gradio.app), [`huggingface_hub`](https://huggingface.co/docs/huggingface_hub/v0.22.2/en/index), and the [Hugging Face Inference API](https://huggingface.co/docs/api-inference/index).

 pinned: false
 ---
+An example chatbot using [Gradio](https://gradio.app), [`huggingface_hub`](https://huggingface.co/docs/huggingface_hub/v0.22.2/en/index), and the [Hugging Face Inference API](https://huggingface.co/docs/api-inference/index).
+# Status Law Assistant
+Чат-бот на базе Hugging Face и LangChain для юридической консультации на основе информации с сайта компании Status Law.
+## 📝 Описание
+Status Law Assistant — это интеллектуальный чат-бот, который отвечает на вопросы пользователей о юридических услугах компании Status Law. Бот использует технологию RAG (Retrieval-Augmented Generation), чтобы находить релевантную информацию в базе знаний, созданной на основе содержимого официального сайта компании, и генерировать на её основе ответы с помощью языковой модели.
+## ✨ Возможности
+- Автоматическое создание и обновление базы знаний на основе контента сайта status.law
+- Поиск релевантной информации для ответа на вопросы пользователей
+- Генерация ответов с использованием контекстно-ориентированного подхода
+- Поддержка многоязычных запросов (отвечает на языке вопроса)
+- Настраиваемые параметры генерации текста (температура, количество токенов и т.д.)
+## 🚀 Технологии
+- **LangChain**: для создания цепочек обработки запросов и управления базой знаний
+- **Hugging Face**: для доступа к языковым моделям и хостинга приложения
+- **FAISS**: для эффективного векторного поиска
+- **Gradio**: для создания пользовательского интерфейса
+- **BeautifulSoup**: для извлечения информации с веб-страниц
+## 🏗️ Структура проекта
+- `app.py`: основной файл приложения, в котором определен интерфейс и логика обработки запросов
+- `config/`: директория с конфигурационными файлами
+- `src/`: директория с исходным кодом
+  - `knowledge_base/`: модуль для работы с базой знаний
+  - `models/`: модуль для работы с моделями

app.py CHANGED Viewed

@@ -1,32 +1,70 @@
 import gradio as gr
 from huggingface_hub import InferenceClient
-"""
-For more information on `huggingface_hub` Inference API support, please check the docs: https://huggingface.co/docs/huggingface_hub/v0.22.2/en/guides/inference
-"""
-client = InferenceClient("HuggingFaceH4/zephyr-7b-beta")
 def respond(
     message,
-    history: list[tuple[str, str]],
     system_message,
     max_tokens,
     temperature,
     top_p,
 ):
-    messages = [{"role": "system", "content": system_message}]
-    for val in history:
-        if val[0]:
-            messages.append({"role": "user", "content": val[0]})
-        if val[1]:
-            messages.append({"role": "assistant", "content": val[1]})
     messages.append({"role": "user", "content": message})
     response = ""
     for message in client.chat_completion(
         messages,
         max_tokens=max_tokens,
@@ -35,30 +73,89 @@ def respond(
         top_p=top_p,
     ):
         token = message.choices[0].delta.content
-        response += token
-        yield response
-"""
-For information on how to customize the ChatInterface, peruse the gradio docs: https://www.gradio.app/docs/chatinterface
-"""
-demo = gr.ChatInterface(
-    respond,
-    additional_inputs=[
-        gr.Textbox(value="You are a friendly Chatbot.", label="System message"),
-        gr.Slider(minimum=1, maximum=2048, value=512, step=1, label="Max new tokens"),
-        gr.Slider(minimum=0.1, maximum=4.0, value=0.7, step=0.1, label="Temperature"),
-        gr.Slider(
-            minimum=0.1,
-            maximum=1.0,
-            value=0.95,
-            step=0.05,
-            label="Top-p (nucleus sampling)",
-        ),
-    ],
-)
 if __name__ == "__main__":
-    demo.launch()

 import gradio as gr
+import os
 from huggingface_hub import InferenceClient
+from config.constants import DEFAULT_SYSTEM_MESSAGE
+from config.settings import DEFAULT_MODEL
+from src.knowledge_base.vector_store import create_vector_store, load_vector_store
+# Создаем клиент для инференса
+client = InferenceClient(DEFAULT_MODEL)
+# Состояние для хранения контекста
+context_store = {}
+def get_context(message, conversation_id):
+    """Получение контекста из базы знаний"""
+    vector_store = load_vector_store()
+    if vector_store is None:
+        return "База знаний не найдена. Пожалуйста, создайте её сначала."
+    try:
+        # Извлечение контекста
+        context_docs = vector_store.similarity_search(message, k=3)
+        context_text = "\n\n".join([f"Из {doc.metadata.get('source', 'неизвестно')}: {doc.page_content}" for doc in context_docs])
+        # Сохраняем контекст для этого разговора
+        context_store[conversation_id] = context_text
+        return context_text
+    except Exception as e:
+        print(f"Ошибка при получении контекста: {str(e)}")
+        return ""
 def respond(
     message,
+    history,
+    conversation_id,
     system_message,
     max_tokens,
     temperature,
     top_p,
 ):
+    # Если это новый разговор, создаем ID
+    if not conversation_id:
+        import uuid
+        conversation_id = str(uuid.uuid4())
+    # Получаем контекст из базы знаний
+    context = get_context(message, conversation_id)
+    # Формируем полную системную инструкцию с контекстом
+    full_system_message = system_message
+    if context:
+        full_system_message += f"\n\nКонтекст для ответа:\n{context}"
+    # Формируем сообщения для LLM
+    messages = [{"role": "system", "content": full_system_message}]
+    # Преобразуем историю в формат для API
+    for user_msg, bot_msg in history:
+        messages.append({"role": "user", "content": user_msg})
+        messages.append({"role": "assistant", "content": bot_msg})
+    # Добавляем текущее сообщение пользователя
     messages.append({"role": "user", "content": message})
+    # Отправляем запрос к API и стримим ответ
     response = ""
     for message in client.chat_completion(
         messages,
         max_tokens=max_tokens,
         top_p=top_p,
     ):
         token = message.choices[0].delta.content
+        if token:
+            response += token
+            yield response, conversation_id
+def build_kb():
+    """Функция для создания базы знаний"""
+    try:
+        success, message = create_vector_store()
+        return message
+    except Exception as e:
+        return f"Ошибка при создании базы знаний: {str(e)}"
+# Создаем интерфейс
+with gr.Blocks() as demo:
+    gr.Markdown("# 🤖 Status Law Assistant")
+    conversation_id = gr.State(None)
+    with gr.Row():
+        with gr.Column(scale=3):
+            chatbot = gr.Chatbot(label="Чат")
+            with gr.Row():
+                msg = gr.Textbox(
+                    label="Ваш вопрос",
+                    placeholder="Введите ваш вопрос...",
+                    scale=4
+                )
+                submit_btn = gr.Button("Отправить", variant="primary")
+        with gr.Column(scale=1):
+            gr.Markdown("### Управление базой знаний")
+            build_kb_btn = gr.Button("Создать/обновить базу знаний", variant="primary")
+            kb_status = gr.Textbox(label="Статус базы знаний", interactive=False)
+            gr.Markdown("### Настройки чата")
+            system_message = gr.Textbox(
+                label="Системное сообщение",
+                value=DEFAULT_SYSTEM_MESSAGE,
+                lines=5
+            )
+            max_tokens = gr.Slider(
+                minimum=1,
+                maximum=2048,
+                value=512,
+                step=1,
+                label="Максимальное количество токенов"
+            )
+            temperature = gr.Slider(
+                minimum=0.1,
+                maximum=2.0,
+                value=0.7,
+                step=0.1,
+                label="Температура"
+            )
+            top_p = gr.Slider(
+                minimum=0.1,
+                maximum=1.0,
+                value=0.95,
+                step=0.05,
+                label="Top-p (nucleus sampling)"
+            )
+            clear_btn = gr.Button("Очистить историю чата")
+    # Обработчики событий
+    msg.submit(
+        respond,
+        [msg, chatbot, conversation_id, system_message, max_tokens, temperature, top_p],
+        [chatbot, conversation_id]
+    )
+    submit_btn.click(
+        respond,
+        [msg, chatbot, conversation_id, system_message, max_tokens, temperature, top_p],
+        [chatbot, conversation_id]
+    )
+    build_kb_btn.click(build_kb, None, kb_status)
+    clear_btn.click(lambda: ([], None), None, [chatbot, conversation_id])
+# Запускаем приложение
 if __name__ == "__main__":
+    # Проверяем наличие базы знаний
+    if not os.path.exists(os.path.join("data", "vector_store", "index.faiss")):
+        print("База знаний не найдена. Создайте её через интерфейс.")
+    demo.launch()

config/__init__.py ADDED Viewed

	@@ -0,0 +1 @@


1	+

config/constants.py ADDED Viewed

	@@ -0,0 +1,49 @@

+# URLs для создания базы знаний
+URLS = [
+     "https://status.law",
+    "https://status.law/about",
+    "https://status.law/careers",
+    "https://status.law/tariffs-for-services-of-protection-against-extradition",
+    "https://status.law/challenging-sanctions",
+    "https://status.law/law-firm-contact-legal-protection",
+    "https://status.law/cross-border-banking-legal-issues",
+    "https://status.law/extradition-defense",
+    "https://status.law/international-prosecution-protection",
+    "https://status.law/interpol-red-notice-removal",
+    "https://status.law/practice-areas",
+    "https://status.law/reputation-protection",
+    "https://status.law/faq"
+]
+# Настройки для чанкирования текста
+CHUNK_SIZE = 500
+CHUNK_OVERLAP = 100
+# Шаблон системного сообщения
+DEFAULT_SYSTEM_MESSAGE = """
+You are a helpful and polite legal assistant at Status Law.
+            You answer in the language in which the question was asked.
+            Answer the question based on the context provided.
+            If you cannot answer based on the context, say so politely and offer to contact Status Law directly via the following channels:
+            - For all users: +32465594521 (landline phone).
+            - For English and Swedish speakers only: +46728495129 (available on WhatsApp, Telegram, Signal, IMO).
+            - Provide a link to the contact form: [Contact Form](https://status.law/law-firm-contact-legal-protection/).
+            If the user has questions about specific services and their costs, suggest they visit the page https://status.law/tariffs-for-services-of-protection-against-extradition-and-international-prosecution/ for detailed information.
+            Ask the user additional questions to understand which service to recommend and provide an estimated cost. For example, clarify their situation and needs to suggest the most appropriate options.
+            Also, offer free consultations if they are available and suitable for the user's request.
+            Answer professionally but in a friendly manner.
+            Example:
+            Q: How can I challenge the sanctions?
+            A: To challenge the sanctions, you should consult with our legal team, who specialize in this area. Please contact us directly for detailed advice. You can fill out our contact form here: [Contact Form](https://status.law/law-firm-contact-legal-protection/).
+            Context: {context}
+            Question: {question}
+            Response Guidelines:
+            1. Answer in the user's language
+            2. Cite sources when possible
+            3. Offer contact options if unsure
+"""

config/settings.py ADDED Viewed

	@@ -0,0 +1,13 @@

+import os
+from dotenv import load_dotenv
+# Загрузка переменных окружения
+load_dotenv()
+# Пути к директориям
+BASE_DIR = os.path.dirname(os.path.dirname(os.path.abspath(__file__)))
+VECTOR_STORE_PATH = os.path.join(BASE_DIR, "data", "vector_store")
+# Настройки моделей
+EMBEDDING_MODEL = "sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2"
+DEFAULT_MODEL = "HuggingFaceH4/zephyr-7b-beta"  # Модель по умолчанию из шаблона

requirements.txt CHANGED Viewed

	@@ -1 +1,12 @@
1	- huggingface_hub==0.25.2

+huggingface_hub==0.25.2
+gradio>=4.0.0
+langchain>=0.1.0
+langchain-community>=0.0.11
+langchain-core>=0.1.10
+langchain-text-splitters>=0.0.1
+langchain-huggingface>=0.0.1
+faiss-cpu>=1.7.4
+sentence-transformers>=2.2.2
+beautifulsoup4>=4.12.2
+requests>=2.31.0
+python-dotenv>=1.0.0

src/__init__.py ADDED Viewed

	@@ -0,0 +1 @@


1	+

src/interface/__init__.py ADDED Viewed

	@@ -0,0 +1 @@


1	+

src/knowledge_base/__init__.py ADDED Viewed

	@@ -0,0 +1 @@


1	+

src/knowledge_base/loader.py ADDED Viewed

	@@ -0,0 +1,28 @@

+import requests
+from bs4 import BeautifulSoup
+from langchain_community.document_loaders import WebBaseLoader
+from langchain_core.documents import Document
+from config.constants import URLS
+def load_documents():
+    """Загрузка документов с веб-сайта"""
+    documents = []
+    headers = {
+        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36',
+    }
+    for url in URLS:
+        try:
+            loader = WebBaseLoader(
+                web_paths=[url],
+                header_template=headers
+            )
+            docs = loader.load()
+            if docs:
+                documents.extend(docs)
+                print(f"Загружено {url}: {len(docs)} документов")
+        except Exception as e:
+            print(f"Ошибка загрузки {url}: {str(e)}")
+    return documents

src/knowledge_base/vector_store.py ADDED Viewed

	@@ -0,0 +1,59 @@

+import os
+from langchain_text_splitters import RecursiveCharacterTextSplitter
+from langchain_community.vectorstores import FAISS
+from langchain_huggingface import HuggingFaceEmbeddings
+from src.knowledge_base.loader import load_documents
+from config.settings import VECTOR_STORE_PATH, EMBEDDING_MODEL
+from config.constants import CHUNK_SIZE, CHUNK_OVERLAP
+def get_embeddings():
+    """Получение модели эмбеддингов"""
+    return HuggingFaceEmbeddings(
+        model_name=EMBEDDING_MODEL,
+        model_kwargs={'device': 'cpu'}
+    )
+def create_vector_store():
+    """Создание или обновление векторного хранилища"""
+    # Загрузка документов
+    documents = load_documents()
+    if not documents:
+        return False, "Ошибка: документы не загружены"
+    # Разделение на чанки
+    text_splitter = RecursiveCharacterTextSplitter(
+        chunk_size=CHUNK_SIZE,
+        chunk_overlap=CHUNK_OVERLAP
+    )
+    chunks = text_splitter.split_documents(documents)
+    # Инициализация эмбеддингов
+    embeddings = get_embeddings()
+    # Создание векторного хранилища
+    vector_store = FAISS.from_documents(chunks, embeddings)
+    # Сохранение
+    os.makedirs(VECTOR_STORE_PATH, exist_ok=True)
+    vector_store.save_local(folder_path=VECTOR_STORE_PATH)
+    return True, f"База знаний создана успешно! Загружено {len(documents)} документов, создано {len(chunks)} чанков."
+def load_vector_store():
+    """Загрузка векторного хранилища"""
+    embeddings = get_embeddings()
+    if not os.path.exists(os.path.join(VECTOR_STORE_PATH, "index.faiss")):
+        return None
+    try:
+        vector_store = FAISS.load_local(
+            VECTOR_STORE_PATH,
+            embeddings,
+            allow_dangerous_deserialization=True
+        )
+        return vector_store
+    except Exception as e:
+        print(f"Ошибка загрузки векторного хранилища: {str(e)}")
+        return None

src/models/__init__.py ADDED Viewed

	@@ -0,0 +1 @@


1	+

utils/__init__.py ADDED Viewed

	@@ -0,0 +1 @@


1	+