Spaces:

diginoron
/

tiyam-chatbot

Sleeping

App Files Files Community

diginoron commited on Mar 27

Commit

0f5d2ed

verified ·

1 Parent(s): 2ebf381

Update app.py

Browse files

Files changed (1) hide show

app.py +53 -14

app.py CHANGED Viewed

@@ -1,36 +1,75 @@
 # app.py
-from sentence_transformers import SentenceTransformer
-from pinecone import Pinecone
 import json
 import gradio as gr
-# بارگذاری مدل embedding
-model = SentenceTransformer('paraphrase-multilingual-MiniLM-L12-v2')
-# بارگذاری داده محلی برای نمایش اولیه (در صورت نیاز)
 with open("tiyam_qa_data.json", "r", encoding="utf-8") as f:
     data = json.load(f)
-# اتصال به Pinecone
-pc = Pinecone(api_key="pcsk_6p6AmJ_Qua4tQN69badNHEGZTj3tt5Bd7LiyiDGcXDj92LxSaBzK2ypYxTRx2rafTEJhjL")  # 🔐 جایگزین کن با کلیدت
-index = pc.Index("tiyam-chat")  # ایندکس از قبل ساخته‌شده
-# تابع پاسخ‌گو
 def retrieve_answer(query, threshold=0.65, top_k=3):
-    query_embedding = model.encode([query])[0]
     result = index.query(vector=query_embedding.tolist(), top_k=top_k, include_metadata=True)
     if result['matches'] and result['matches'][0]['score'] > threshold:
-        print(f"📊 Similarity: {result['matches'][0]['score']:.3f}")
         metadata = result['matches'][0]['metadata']
         return metadata.get('answer', 'پاسخ یافت نشد')
     else:
         return "متأسفم، پاسخ دقیقی برای این سوال نداریم. لطفاً با ما تماس بگیرید."
-# رابط Gradio
 def chat_interface(question):
-    return retrieve_answer(question)
-demo = gr.Interface(fn=chat_interface, inputs="text", outputs="text", title="چت‌بات تیام", description="سؤالات خود را از آژانس دیجیتال مارکتینگ تیام بپرسید.")
 demo.launch()

 # app.py
+import os
 import json
+import torch
 import gradio as gr
+from pinecone import Pinecone
+from sentence_transformers import SentenceTransformer
+from transformers import AutoTokenizer, AutoModelForCausalLM
+# 🔐 گرفتن کلیدها از Environment Variables (Secrets در Hugging Face)
+PINECONE_API_KEY = os.environ.get("PINECONE_API_KEY")
+PINECONE_INDEX_NAME = os.environ.get("INDEX_NAME", "tiyam-chat")
+HF_TOKEN = os.environ.get("HF_TOKEN")
+# 🔹 بارگذاری مدل embedding
+embedding_model = SentenceTransformer('paraphrase-multilingual-MiniLM-L12-v2')
+# 🔹 بارگذاری داده‌ها (اختیاری برای تست لوکال)
 with open("tiyam_qa_data.json", "r", encoding="utf-8") as f:
     data = json.load(f)
+# 🔹 اتصال به Pinecone
+pc = Pinecone(api_key=PINECONE_API_KEY)
+index = pc.Index(PINECONE_INDEX_NAME)
+# 🔹 بارگذاری مدل GEMMA
+tokenizer = AutoTokenizer.from_pretrained("google/gemma-2b-it", token=HF_TOKEN)
+model = AutoModelForCausalLM.from_pretrained("google/gemma-2b-it", token=HF_TOKEN)
+device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
+model = model.to(device)
+# 🔹 گرفتن پاسخ از Pinecone
 def retrieve_answer(query, threshold=0.65, top_k=3):
+    query_embedding = embedding_model.encode([query])[0]
     result = index.query(vector=query_embedding.tolist(), top_k=top_k, include_metadata=True)
     if result['matches'] and result['matches'][0]['score'] > threshold:
         metadata = result['matches'][0]['metadata']
         return metadata.get('answer', 'پاسخ یافت نشد')
     else:
         return "متأسفم، پاسخ دقیقی برای این سوال نداریم. لطفاً با ما تماس بگیرید."
+# 🔹 بازنویسی پاسخ با GEMMA
+def rewrite_answer(question, retrieved_answer):
+    prompt = f"""سؤال: {question}
+پاسخ اولیه: {retrieved_answer}
+پاسخ نهایی را به زبان طبیعی، حرفه‌ای و دوستانه بازنویسی کن:"""
+    inputs = tokenizer(prompt, return_tensors="pt").to(device)
+    outputs = model.generate(
+        **inputs,
+        max_new_tokens=150,
+        temperature=0.7,
+        do_sample=True,
+        top_p=0.9
+    )
+    final_answer = tokenizer.decode(outputs[0], skip_special_tokens=True)
+    return final_answer.replace(prompt, "").strip()
+# 🔹 رابط Gradio
 def chat_interface(question):
+    raw_answer = retrieve_answer(question)
+    final_answer = rewrite_answer(question, raw_answer)
+    return final_answer
+demo = gr.Interface(
+    fn=chat_interface,
+    inputs="text",
+    outputs="text",
+    title="💬 چت‌بات هوشمند تیام",
+    description="سؤالات خود درباره خدمات بازاریابی دیجیتال تیام را بپرسید."
+)
 demo.launch()