Spaces:

diginoron
/

tiyam-chatbot

Sleeping

App Files Files Community

diginoron commited on Mar 24

Commit

f957bce

verified ·

1 Parent(s): 7756f95

Update app.py

Browse files

Files changed (1) hide show

app.py +26 -56

app.py CHANGED Viewed

@@ -1,65 +1,35 @@
-import os
-import gradio as gr
-import torch
-from pinecone import Pinecone
 from sentence_transformers import SentenceTransformer
-from transformers import AutoTokenizer, AutoModelForQuestionAnswering
-# بارگذاری کلیدها
-PINECONE_API_KEY = os.environ.get("PINECONE_API_KEY")
-INDEX_NAME = os.environ.get("INDEX_NAME")
-# مدل embedding
-embedder = SentenceTransformer("sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2")
-# مدل QA فارسی
-tokenizer = AutoTokenizer.from_pretrained("diginoron/qa-bert-fa-model")
-model = AutoModelForQuestionAnswering.from_pretrained("diginoron/qa-bert-fa-model")
-# اتصال به پایگاه داده Pinecone
-pc = Pinecone(api_key=PINECONE_API_KEY)
-index = pc.Index(INDEX_NAME)
-# تابع RAG
-def rag_chatbot(message, history):
-    greetings = ["سلام", "سلام وقت بخیر", "درود", "خسته نباشید"]
-    if message.strip() in greetings:
-        return "سلام! چطور می‌تونم کمکتون کنم؟ 😊"
-    # مرحله ۱: بازیابی نزدیک‌ترین اسناد
-    query_vector = embedder.encode(message).tolist()
-    result = index.query(vector=query_vector, top_k=3, include_metadata=True)
-    if not result['matches']:
-        return "متأسفم، اطلاعاتی در پایگاه داده پیدا نکردم."
-    context = "\n".join([match['metadata'].get("پاسخ", "") for match in result['matches'] if match['metadata'].get("پاسخ")])
-    if not context.strip():
-        return "متأسفم، اطلاعات کافی در این زمینه ندارم."
-    # مرحله ۲: استفاده از مدل پاسخ‌گویی BERT
-    inputs = tokenizer(message, context, return_tensors="pt", truncation=True, max_length=512)
-    with torch.no_grad():
-        outputs = model(**inputs)
-    start_idx = torch.argmax(outputs.start_logits)
-    end_idx = torch.argmax(outputs.end_logits)
-    answer_tokens = inputs["input_ids"][0][start_idx:end_idx + 1]
-    answer = tokenizer.decode(answer_tokens, skip_special_tokens=True)
-    if not answer.strip() or answer.strip() in ["[CLS]", "[SEP]"]:
-        return "متأسفم، نتونستم پاسخ دقیقی پیدا کنم."
-    return answer.strip()
 # رابط Gradio
-chat_ui = gr.ChatInterface(
-    fn=rag_chatbot,
-    title="🤖 چت‌بات هوشمند تیام (نسخه RAG)",
-    description="پاسخ‌گویی ترکیبی بر پایه داده‌های واقعی شرکت + تولید پاسخ با مدل BERT فارسی",
-    theme="soft",
-)
-chat_ui.launch()

+# app.py
 from sentence_transformers import SentenceTransformer
+from pinecone import Pinecone
+import json
+import gradio as gr
+# بارگذاری مدل embedding
+model = SentenceTransformer('paraphrase-multilingual-MiniLM-L12-v2')
+# بارگذاری داده محلی برای نمایش اولیه (در صورت نیاز)
+with open("tiyam_qa_data.json", "r", encoding="utf-8") as f:
+    data = json.load(f)
+# اتصال به Pinecone
+pc = Pinecone(api_key="pcsk_6p6AmJ_Qua4tQN69badNHEGZTj3tt5Bd7LiyiDGcXDj92LxSaBzK2ypYxTRx2rafTEJhjL")  # 🔐 جایگزین کن با کلیدت
+index = pc.Index("tiyam-chat")  # ایندکس از قبل ساخته‌شده
+# تابع پاسخ‌گو
+def retrieve_answer(query, threshold=0.4, top_k=1):
+    query_embedding = model.encode([query])[0]
+    result = index.query(vector=query_embedding.tolist(), top_k=top_k, include_metadata=True)
+    if result['matches'] and result['matches'][0]['score'] > threshold:
+        metadata = result['matches'][0]['metadata']
+        return metadata.get('answer', 'پاسخ یافت نشد')
+    else:
+        return "متأسفم، پاسخ دقیقی برای این سوال نداریم. لطفاً با ما تماس بگیرید."
 # رابط Gradio
+def chat_interface(question):
+    return retrieve_answer(question)
+demo = gr.Interface(fn=chat_interface, inputs="text", outputs="text", title="چت‌بات تیام", description="سؤالات خود را از آژانس دیجیتال مارکتینگ تیام بپرسید.")
+demo.launch()