Spaces:

diginoron
/

tiyam-chatbot

Sleeping

App Files Files Community

diginoron commited on Mar 27

Commit

8bb4acb

verified ·

1 Parent(s): 0765207

Update app.py

Browse files

Files changed (1) hide show

app.py +14 -7

app.py CHANGED Viewed

@@ -4,19 +4,26 @@ import os
 import json
 import torch
 import gradio as gr
 from pinecone import Pinecone
 from sentence_transformers import SentenceTransformer
 from transformers import AutoTokenizer, AutoModelForCausalLM
-# 🔐 گرفتن سکرت‌ها از محیط
 PINECONE_API_KEY = os.environ.get("PINECONE_API_KEY")
 PINECONE_INDEX_NAME = os.environ.get("INDEX_NAME", "tiyam-chat")
 HF_TOKEN = os.environ.get("HF_TOKEN")
-# 🔹 بارگذاری مدل عمومی embedding (بدون نیاز به توکن)
-embedding_model = SentenceTransformer('sentence-transformers/distiluse-base-multilingual-cased-v2')
-# 🔹 بارگذاری داده‌های اولیه (اختیاری)
 with open("tiyam_qa_data.json", "r", encoding="utf-8") as f:
     data = json.load(f)
@@ -24,13 +31,13 @@ with open("tiyam_qa_data.json", "r", encoding="utf-8") as f:
 pc = Pinecone(api_key=PINECONE_API_KEY)
 index = pc.Index(PINECONE_INDEX_NAME)
-# 🔹 بارگذاری مدل GEMMA برای بازنویسی
 tokenizer = AutoTokenizer.from_pretrained("google/gemma-2b-it", token=HF_TOKEN)
 model = AutoModelForCausalLM.from_pretrained("google/gemma-2b-it", token=HF_TOKEN)
 device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
 model = model.to(device)
-# 🔹 بازیابی پاسخ اولیه از Pinecone
 def retrieve_answer(query, threshold=0.65, top_k=3):
     query_embedding = embedding_model.encode([query])[0]
     result = index.query(vector=query_embedding.tolist(), top_k=top_k, include_metadata=True)
@@ -41,7 +48,7 @@ def retrieve_answer(query, threshold=0.65, top_k=3):
     else:
         return "متأسفم، پاسخ دقیقی برای این سوال نداریم. لطفاً با ما تماس بگیرید."
-# 🔹 بازنویسی پاسخ با GEMMA
 def rewrite_answer(question, retrieved_answer):
     prompt = f"""سؤال: {question}
 پاسخ اولیه: {retrieved_answer}

 import json
 import torch
 import gradio as gr
+from huggingface_hub import login
 from pinecone import Pinecone
 from sentence_transformers import SentenceTransformer
 from transformers import AutoTokenizer, AutoModelForCausalLM
+# 🔐 خواندن سکرت‌ها
 PINECONE_API_KEY = os.environ.get("PINECONE_API_KEY")
 PINECONE_INDEX_NAME = os.environ.get("INDEX_NAME", "tiyam-chat")
 HF_TOKEN = os.environ.get("HF_TOKEN")
+if not HF_TOKEN:
+    raise ValueError("❌ سکرت HF_TOKEN یافت نشد. لطفاً آن را در Settings > Secrets ثبت کنید.")
+# 🔐 ورود به Hugging Face برای دسترسی به مدل خصوصی
+login(token=HF_TOKEN)
+# 🔹 بارگذاری مدل embedding خصوصی
+embedding_model = SentenceTransformer('sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2')
+# 🔹 بارگذاری داده محلی (اختیاری برای تست یا توسعه)
 with open("tiyam_qa_data.json", "r", encoding="utf-8") as f:
     data = json.load(f)
 pc = Pinecone(api_key=PINECONE_API_KEY)
 index = pc.Index(PINECONE_INDEX_NAME)
+# 🔹 بارگذاری مدل GEMMA برای بازنویسی طبیعی پاسخ
 tokenizer = AutoTokenizer.from_pretrained("google/gemma-2b-it", token=HF_TOKEN)
 model = AutoModelForCausalLM.from_pretrained("google/gemma-2b-it", token=HF_TOKEN)
 device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
 model = model.to(device)
+# 🔹 گرفتن پاسخ خام از Pinecone
 def retrieve_answer(query, threshold=0.65, top_k=3):
     query_embedding = embedding_model.encode([query])[0]
     result = index.query(vector=query_embedding.tolist(), top_k=top_k, include_metadata=True)
     else:
         return "متأسفم، پاسخ دقیقی برای این سوال نداریم. لطفاً با ما تماس بگیرید."
+# 🔹 بازنویسی پاسخ خام با GEMMA
 def rewrite_answer(question, retrieved_answer):
     prompt = f"""سؤال: {question}
 پاسخ اولیه: {retrieved_answer}