Spaces:

diginoron
/

tiyam-chatbot

Sleeping

App Files Files Community

tiyam-chatbot / app.py

diginoron

Update app.py

0f5d2ed verified 3 months ago

raw

history blame

2.81 kB

	# app.py

	import os
	import json
	import torch
	import gradio as gr
	from pinecone import Pinecone
	from sentence_transformers import SentenceTransformer
	from transformers import AutoTokenizer, AutoModelForCausalLM

	# 🔐 گرفتن کلیدها از Environment Variables (Secrets در Hugging Face)
	PINECONE_API_KEY = os.environ.get("PINECONE_API_KEY")
	PINECONE_INDEX_NAME = os.environ.get("INDEX_NAME", "tiyam-chat")
	HF_TOKEN = os.environ.get("HF_TOKEN")

	# 🔹 بارگذاری مدل embedding
	embedding_model = SentenceTransformer('paraphrase-multilingual-MiniLM-L12-v2')

	# 🔹 بارگذاری داده‌ها (اختیاری برای تست لوکال)
	with open("tiyam_qa_data.json", "r", encoding="utf-8") as f:
	data = json.load(f)

	# 🔹 اتصال به Pinecone
	pc = Pinecone(api_key=PINECONE_API_KEY)
	index = pc.Index(PINECONE_INDEX_NAME)

	# 🔹 بارگذاری مدل GEMMA
	tokenizer = AutoTokenizer.from_pretrained("google/gemma-2b-it", token=HF_TOKEN)
	model = AutoModelForCausalLM.from_pretrained("google/gemma-2b-it", token=HF_TOKEN)
	device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
	model = model.to(device)

	# 🔹 گرفتن پاسخ از Pinecone
	def retrieve_answer(query, threshold=0.65, top_k=3):
	query_embedding = embedding_model.encode([query])[0]
	result = index.query(vector=query_embedding.tolist(), top_k=top_k, include_metadata=True)

	if result['matches'] and result['matches'][0]['score'] > threshold:
	metadata = result['matches'][0]['metadata']
	return metadata.get('answer', 'پاسخ یافت نشد')
	else:
	return "متأسفم، پاسخ دقیقی برای این سوال نداریم. لطفاً با ما تماس بگیرید."

	# 🔹 بازنویسی پاسخ با GEMMA
	def rewrite_answer(question, retrieved_answer):
	prompt = f"""سؤال: {question}
	پاسخ اولیه: {retrieved_answer}
	پاسخ نهایی را به زبان طبیعی، حرفه‌ای و دوستانه بازنویسی کن:"""

	inputs = tokenizer(prompt, return_tensors="pt").to(device)
	outputs = model.generate(
	**inputs,
	max_new_tokens=150,
	temperature=0.7,
	do_sample=True,
	top_p=0.9
	)
	final_answer = tokenizer.decode(outputs[0], skip_special_tokens=True)
	return final_answer.replace(prompt, "").strip()

	# 🔹 رابط Gradio
	def chat_interface(question):
	raw_answer = retrieve_answer(question)
	final_answer = rewrite_answer(question, raw_answer)
	return final_answer

	demo = gr.Interface(
	fn=chat_interface,
	inputs="text",
	outputs="text",
	title="💬 چت‌بات هوشمند تیام",
	description="سؤالات خود درباره خدمات بازاریابی دیجیتال تیام را بپرسید."
	)

	demo.launch()