Spaces:

diginoron
/

tiyam-chatbot

Sleeping

App Files Files Community

diginoron commited on Mar 24

Commit

74c93be

verified ·

1 Parent(s): 5e3291f

Update app.py

Browse files

Files changed (1) hide show

app.py +26 -24

app.py CHANGED Viewed

@@ -4,68 +4,70 @@ from sentence_transformers import SentenceTransformer
 from transformers import AutoTokenizer, AutoModelForQuestionAnswering
 from pinecone import Pinecone
-# بارگذاری مقادیر محرمانه از محیط
 PINECONE_API_KEY = os.environ.get("PINECONE_API_KEY")
 INDEX_NAME = os.environ.get("INDEX_NAME")
 # مدل embedding
 embedder = SentenceTransformer("sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2")
-# مدل پاسخ به سوال فارسی
-tokenizer = AutoTokenizer.from_pretrained("SeyedAli/Persian-QA-Bert-V1")
-model = AutoModelForQuestionAnswering.from_pretrained("SeyedAli/Persian-QA-Bert-V1")
 # اتصال به Pinecone
 pc = Pinecone(api_key=PINECONE_API_KEY)
 index = pc.Index(INDEX_NAME)
-# پاسخ به سلام و احوال‌پرسی
 greetings = ["سلام", "سلام وقت بخیر", "درود", "خسته نباشید"]
 def is_greeting(text):
-    return any(text.strip().startswith(greet) for greet in greetings)
 # تابع اصلی چت‌بات
 def rag_chatbot(message, history):
     if is_greeting(message):
         return "سلام! چطور می‌تونم کمکتون کنم؟ 😊"
-    # مرحله 1: بازیابی داده‌های مرتبط از Pinecone
     query_vector = embedder.encode(message).tolist()
     result = index.query(vector=query_vector, top_k=3, include_metadata=True)
     if not result["matches"]:
-        return "متأسفم، پاسخ مشخصی برای این سؤال در پایگاه داده ندارم."
-    # مرحله 2: استخراج متون بازیابی‌شده
-    contexts = [match["metadata"].get("پاسخ", "") for match in result["matches"]]
     best_answer = ""
     best_score = -float("inf")
-    for context in contexts:
         inputs = tokenizer.encode_plus(message, context, return_tensors="pt", truncation=True)
         outputs = model(**inputs)
-        answer_start = int(outputs.start_logits.argmax())
-        answer_end = int(outputs.end_logits.argmax())
-        score = float(outputs.start_logits[0][answer_start] + outputs.end_logits[0][answer_end])
-        answer = tokenizer.convert_tokens_to_string(
-            tokenizer.convert_ids_to_tokens(inputs["input_ids"][0][answer_start:answer_end + 1])
-        )
-        if score > best_score and answer.strip() != "":
             best_score = score
             best_answer = answer
-    if best_answer.strip() == "":
-        return "متأسفم، اطلاعات کافی برای پاسخ دقیق ندارم. لطفاً تماس بگیرید."
-    return best_answer.strip()
-# رابط کاربری Gradio
 chat_ui = gr.ChatInterface(
     fn=rag_chatbot,
     title="🤖 چت‌بات هوشمند تیام (نسخه RAG)",
-    description="پاسخ‌گویی ترکیبی بر پایه داده‌های واقعی شرکت + تولید متن با مدل فارسی BERT",
     theme="soft",
 )

 from transformers import AutoTokenizer, AutoModelForQuestionAnswering
 from pinecone import Pinecone
+# بارگذاری مقادیر محرمانه
 PINECONE_API_KEY = os.environ.get("PINECONE_API_KEY")
 INDEX_NAME = os.environ.get("INDEX_NAME")
 # مدل embedding
 embedder = SentenceTransformer("sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2")
+# مدل BERT فارسی برای QA
+model_id = "SeyedAli/Persian-QA-Bert-V1"
+tokenizer = AutoTokenizer.from_pretrained(model_id)
+model = AutoModelForQuestionAnswering.from_pretrained(model_id)
 # اتصال به Pinecone
 pc = Pinecone(api_key=PINECONE_API_KEY)
 index = pc.Index(INDEX_NAME)
+# احوالپرسی هوشمند
 greetings = ["سلام", "سلام وقت بخیر", "درود", "خسته نباشید"]
 def is_greeting(text):
+    return any(text.strip().startswith(g) for g in greetings)
 # تابع اصلی چت‌بات
 def rag_chatbot(message, history):
     if is_greeting(message):
         return "سلام! چطور می‌تونم کمکتون کنم؟ 😊"
+    # ۱. جستجو در Pinecone
     query_vector = embedder.encode(message).tolist()
     result = index.query(vector=query_vector, top_k=3, include_metadata=True)
     if not result["matches"]:
+        return "متأسفم، اطلاعاتی برای این سوال در پایگاه داده پیدا نکردم."
     best_answer = ""
     best_score = -float("inf")
+    for match in result["matches"]:
+        context = match["metadata"].get("پاسخ", "")
         inputs = tokenizer.encode_plus(message, context, return_tensors="pt", truncation=True)
         outputs = model(**inputs)
+        start_logits = outputs.start_logits[0]
+        end_logits = outputs.end_logits[0]
+        start_idx = int(start_logits.argmax())
+        end_idx = int(end_logits.argmax())
+        score = float(start_logits[start_idx] + end_logits[end_idx])
+        answer_tokens = inputs["input_ids"][0][start_idx:end_idx + 1]
+        answer = tokenizer.decode(answer_tokens, skip_special_tokens=True).strip()
+        if score > best_score and answer not in ["[CLS]", ""]:
             best_score = score
             best_answer = answer
+    if best_answer:
+        return best_answer
+    else:
+        return "متأسفم، نتونستم پاسخ دقیقی پیدا کنم."
+# رابط Gradio
 chat_ui = gr.ChatInterface(
     fn=rag_chatbot,
     title="🤖 چت‌بات هوشمند تیام (نسخه RAG)",
+    description="پاسخ‌گویی ترکیبی بر پایه داده‌های واقعی شرکت + مدل BERT فارسی",
     theme="soft",
 )