Spaces:

diginoron
/

tiyam-chatbot

Sleeping

diginoron commited on Mar 27

Commit

03bc35b

verified ·

1 Parent(s): ae21b5f

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -8,15 +8,18 @@ from pinecone import Pinecone
 from sentence_transformers import SentenceTransformer
 from transformers import AutoTokenizer, AutoModelForCausalLM
-# 🔐 گرفتن کلیدها از Environment Variables (Secrets در Hugging Face)
 PINECONE_API_KEY = os.environ.get("PINECONE_API_KEY")
 PINECONE_INDEX_NAME = os.environ.get("INDEX_NAME", "tiyam-chat")
 HF_TOKEN = os.environ.get("HF_TOKEN")
-# 🔹 بارگذاری مدل embedding
-embedding_model = SentenceTransformer('paraphrase-multilingual-MiniLM-L12-v2')
-# 🔹 بارگذاری داده‌ها (اختیاری برای تست لوکال)
 with open("tiyam_qa_data.json", "r", encoding="utf-8") as f:
     data = json.load(f)
@@ -24,13 +27,13 @@ with open("tiyam_qa_data.json", "r", encoding="utf-8") as f:
 pc = Pinecone(api_key=PINECONE_API_KEY)
 index = pc.Index(PINECONE_INDEX_NAME)
-# 🔹 بارگذاری مدل GEMMA
 tokenizer = AutoTokenizer.from_pretrained("google/gemma-2b-it", token=HF_TOKEN)
 model = AutoModelForCausalLM.from_pretrained("google/gemma-2b-it", token=HF_TOKEN)
 device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
 model = model.to(device)
-# 🔹 گرفتن پاسخ از Pinecone
 def retrieve_answer(query, threshold=0.65, top_k=3):
     query_embedding = embedding_model.encode([query])[0]
     result = index.query(vector=query_embedding.tolist(), top_k=top_k, include_metadata=True)

 from sentence_transformers import SentenceTransformer
 from transformers import AutoTokenizer, AutoModelForCausalLM
+# 🔐 گرفتن سکرت‌ها از محیط
 PINECONE_API_KEY = os.environ.get("PINECONE_API_KEY")
 PINECONE_INDEX_NAME = os.environ.get("INDEX_NAME", "tiyam-chat")
 HF_TOKEN = os.environ.get("HF_TOKEN")
+# 🔹 بارگذاری مدل embedding (با توکن)
+embedding_model = SentenceTransformer(
+    'sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2',
+    use_auth_token=HF_TOKEN
+)
+# 🔹 بارگذاری داده‌ها (اختیاری – فقط برای نمایش اولیه یا تست)
 with open("tiyam_qa_data.json", "r", encoding="utf-8") as f:
     data = json.load(f)
 pc = Pinecone(api_key=PINECONE_API_KEY)
 index = pc.Index(PINECONE_INDEX_NAME)
+# 🔹 بارگذاری مدل GEMMA برای بازنویسی
 tokenizer = AutoTokenizer.from_pretrained("google/gemma-2b-it", token=HF_TOKEN)
 model = AutoModelForCausalLM.from_pretrained("google/gemma-2b-it", token=HF_TOKEN)
 device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
 model = model.to(device)
+# 🔹 بازیابی پاسخ اولیه از Pinecone
 def retrieve_answer(query, threshold=0.65, top_k=3):
     query_embedding = embedding_model.encode([query])[0]
     result = index.query(vector=query_embedding.tolist(), top_k=top_k, include_metadata=True)