Spaces:

diginoron
/

tiyam-chatbot

Sleeping

App Files Files Community

diginoron commited on Mar 27

Commit

012badc

verified ·

1 Parent(s): 4b5b4f3

Update app.py

Browse files

Files changed (1) hide show

app.py +29 -53

app.py CHANGED Viewed

@@ -1,85 +1,61 @@
-# app.py
 import os
 import json
 import torch
 import gradio as gr
-from huggingface_hub import login
-from pinecone import Pinecone
 from sentence_transformers import SentenceTransformer
-from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
-# 📦 گرفتن سکرت‌ها
-PINECONE_API_KEY = os.environ.get("PINECONE_API_KEY")
-PINECONE_INDEX_NAME = os.environ.get("INDEX_NAME", "tiyam-chat")
 HF_TOKEN = os.environ.get("HF_TOKEN")
-if not HF_TOKEN:
-    raise ValueError("❌ سکرت HF_TOKEN یافت نشد. لطفاً آن را در Settings > Secrets ثبت کنید.")
-# 🔐 ورود به Hugging Face
-login(token=HF_TOKEN)
-# 🔹 بارگذاری مدل embedding
-embedding_model = SentenceTransformer('sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2')
-# 🔹 بارگذاری داده اولیه (اختیاری)
-with open("tiyam_qa_data.json", "r", encoding="utf-8") as f:
-    data = json.load(f)
-# 🔹 اتصال به Pinecone
 pc = Pinecone(api_key=PINECONE_API_KEY)
 index = pc.Index(PINECONE_INDEX_NAME)
-# 🔹 بارگذاری مدل سبک mt5-small برای بازنویسی
-tokenizer = AutoTokenizer.from_pretrained("google/mt5-small", token=HF_TOKEN)
-model = AutoModelForSeq2SeqLM.from_pretrained("google/mt5-small", token=HF_TOKEN)
-device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
-model = model.to(device)
-# 🔍 گرفتن پاسخ اولیه از Pinecone
 def retrieve_answer(query, threshold=0.65, top_k=3):
     query_embedding = embedding_model.encode([query])[0]
     result = index.query(vector=query_embedding.tolist(), top_k=top_k, include_metadata=True)
     if result['matches'] and result['matches'][0]['score'] > threshold:
         metadata = result['matches'][0]['metadata']
-        return metadata.get('answer', 'پاسخ یافت نشد')
     else:
         return "متأسفم، پاسخ دقیقی برای این سوال نداریم. لطفاً با ما تماس بگیرید."
-# 🧠 بازنویسی پاسخ با MT5 کوچک
-def rewrite_answer(question, retrieved_answer):
-    prompt = f"""سؤال: {question}
-پاسخ اولیه: {retrieved_answer}
-پاسخ نهایی را به زبان طبیعی، حرفه‌ای و دوستانه بازنویسی کن:"""
-    inputs = tokenizer(prompt, return_tensors="pt").to(device)
-    outputs = model.generate(
-        **inputs,
-        max_new_tokens=96,
-        temperature=0.7,
-        do_sample=True,
-        top_p=0.9
-    )
-    final_answer = tokenizer.decode(outputs[0], skip_special_tokens=True)
-    return final_answer.replace(prompt, "").strip()
-# ✨ رابط نهایی
-def chat_interface(question):
-    print("📥 سوال:", question)
-    raw_answer = retrieve_answer(question)
-    print("📤 پاسخ اولیه:", raw_answer)
-    final_answer = rewrite_answer(question, raw_answer)
-    print("✅ پاسخ نهایی:", final_answer)
-    return final_answer
 demo = gr.Interface(
     fn=chat_interface,
     inputs="text",
     outputs="text",
-    title="💬 چت‌بات هوشمند تیام",
-    description="سؤالات خود درباره خدمات بازاریابی دیجیتال تیام را بپرسید."
 )
 demo.launch()

 import os
 import json
 import torch
 import gradio as gr
 from sentence_transformers import SentenceTransformer
+from pinecone import Pinecone
+from transformers import T5Tokenizer, T5ForConditionalGeneration
+# بارگذاری توکن‌ها از محیط امن
 HF_TOKEN = os.environ.get("HF_TOKEN")
+PINECONE_API_KEY = os.environ.get("PINECONE_API_KEY")
+PINECONE_INDEX_NAME = os.environ.get("PINECONE_INDEX_NAME")
+# بارگذاری مدل embedding
+embedding_model = SentenceTransformer("sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2", use_auth_token=HF_TOKEN)
+# اتصال به Pinecone
 pc = Pinecone(api_key=PINECONE_API_KEY)
 index = pc.Index(PINECONE_INDEX_NAME)
+# بارگذاری مدل زبانی MT5
+tokenizer = T5Tokenizer.from_pretrained("google/mt5-small", token=HF_TOKEN)
+language_model = T5ForConditionalGeneration.from_pretrained("google/mt5-small", token=HF_TOKEN)
+# تابع جستجو در Pinecone
 def retrieve_answer(query, threshold=0.65, top_k=3):
     query_embedding = embedding_model.encode([query])[0]
     result = index.query(vector=query_embedding.tolist(), top_k=top_k, include_metadata=True)
     if result['matches'] and result['matches'][0]['score'] > threshold:
+        print(f"📊 Similarity: {result['matches'][0]['score']:.3f}")
         metadata = result['matches'][0]['metadata']
+        return metadata.get('answer', 'پاسخی یافت نشد.')
     else:
         return "متأسفم، پاسخ دقیقی برای این سوال نداریم. لطفاً با ما تماس بگیرید."
+# تابع تولید پاسخ طبیعی با MT5
+def generate_natural_answer(question, raw_answer):
+    prompt = f"پرسش: {question}\nپاسخ دقیق: {raw_answer}\nپاسخ طبیعی:"
+    inputs = tokenizer(prompt, return_tensors="pt", padding=True).to(language_model.device)
+    with torch.no_grad():
+        outputs = language_model.generate(**inputs, max_new_tokens=128, do_sample=False)
+    return tokenizer.decode(outputs[0], skip_special_tokens=True)
+# اتصال همه‌چیز در رابط Gradio
+def chat_interface(user_question):
+    raw_answer = retrieve_answer(user_question)
+    return generate_natural_answer(user_question, raw_answer)
+# رابط Gradio
 demo = gr.Interface(
     fn=chat_interface,
     inputs="text",
     outputs="text",
+    title="چت‌بات تیام",
+    description="سؤالات خود را از آژانس دیجیتال مارکتینگ تیام بپرسید."
 )
 demo.launch()