Spaces:

diginoron
/

tiyam-chatbot

Sleeping

App Files Files Community

diginoron commited on Mar 27

Commit

ed6acf3

verified ·

1 Parent(s): 3fbac70

Update app.py

Browse files

Files changed (1) hide show

app.py +44 -38

app.py CHANGED Viewed

@@ -1,51 +1,57 @@
 import os
-import gradio as gr
-from pinecone import Pinecone, ServerlessSpec
 from sentence_transformers import SentenceTransformer
-from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
-# بارگیری توکن‌ها از محیط
 HF_TOKEN = os.environ.get("HF_TOKEN")
 PINECONE_API_KEY = os.environ.get("PINECONE_API_KEY")
 PINECONE_INDEX_NAME = os.environ.get("PINECONE_INDEX_NAME")
-# بررسی متغیرها
-assert HF_TOKEN is not None, "❌ Hugging Face token missing!"
-assert PINECONE_API_KEY is not None, "❌ Pinecone API key missing!"
 assert PINECONE_INDEX_NAME is not None, "❌ Pinecone index name is missing!"
-# بارگذاری مدل‌های مورد نیاز
-embedding_model = SentenceTransformer("sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2", token=HF_TOKEN)
-tokenizer = AutoTokenizer.from_pretrained("google/mt5-small", token=HF_TOKEN)
-language_model = AutoModelForSeq2SeqLM.from_pretrained("google/mt5-small", token=HF_TOKEN)
-# اتصال به Pinecone (نسخه جدید)
-pc = Pinecone(api_key=PINECONE_API_KEY)
 index = pc.Index(PINECONE_INDEX_NAME)
-def get_similar_context(question, top_k=1):
-    question_embedding = embedding_model.encode(question).tolist()
-    results = index.query(vector=question_embedding, top_k=top_k, include_metadata=True)
-    if results and results['matches']:
-        return results['matches'][0]['metadata']['text']
-    return ""
-def generate_answer(question):
-    context = get_similar_context(question)
-    if context:
-        prompt = f"پرسش: {question}\nاطلاعات مرتبط: {context}\nپاسخ:"
     else:
-        prompt = f"پرسش: {question}\nپاسخ:"
-    inputs = tokenizer(prompt, return_tensors="pt", padding=True, truncation=True)
-    outputs = language_model.generate(**inputs, max_new_tokens=100)
-    return tokenizer.decode(outputs[0], skip_special_tokens=True)
-# رابط گرافیکی
-gr.Interface(
-    fn=generate_answer,
-    inputs=gr.Textbox(label="سؤال خود را وارد کنید", placeholder="مثلاً خدمات سئو تیام شامل چیست؟"),
-    outputs=gr.Textbox(label="پاسخ هوشمند"),
-    title="🤖 چت‌بات هوشمند تیام",
-    description="با استفاده از داده‌های اختصاصی، پاسخ هوشمندانه دریافت کنید."
-).launch()

 import os
+import pinecone
 from sentence_transformers import SentenceTransformer
+from transformers import T5Tokenizer, T5ForConditionalGeneration
+import torch
+import gradio as gr
+# Load environment variables
 HF_TOKEN = os.environ.get("HF_TOKEN")
 PINECONE_API_KEY = os.environ.get("PINECONE_API_KEY")
 PINECONE_INDEX_NAME = os.environ.get("PINECONE_INDEX_NAME")
+assert HF_TOKEN is not None, "❌ HF token is missing!"
+assert PINECONE_API_KEY is not None, "❌ Pinecone API key is missing!"
 assert PINECONE_INDEX_NAME is not None, "❌ Pinecone index name is missing!"
+# Load embedding model
+embedder = SentenceTransformer("sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2", use_auth_token=HF_TOKEN)
+# Load tokenizer and model
+tokenizer = T5Tokenizer.from_pretrained("google/mt5-small", token=HF_TOKEN)
+model = T5ForConditionalGeneration.from_pretrained("google/mt5-small", token=HF_TOKEN)
+# Initialize Pinecone client
+pc = pinecone.Pinecone(api_key=PINECONE_API_KEY)
 index = pc.Index(PINECONE_INDEX_NAME)
+def query_index(question):
+    # Embed question
+    question_embedding = embedder.encode(question).tolist()
+    # Query Pinecone
+    results = index.query(vector=question_embedding, top_k=1, include_metadata=True)
+    if results.matches:
+        retrieved_text = results.matches[0].metadata.get("text", "")
     else:
+        retrieved_text = "متاسفم، پاسخ مناسبی پیدا نکردم."
+    # Generate answer
+    input_text = f"پرسش: {question} \n پاسخ بر اساس دانش: {retrieved_text}"
+    input_ids = tokenizer(input_text, return_tensors="pt", truncation=True).input_ids
+    output_ids = model.generate(input_ids, max_length=100)
+    answer = tokenizer.decode(output_ids[0], skip_special_tokens=True)
+    return answer
+# Gradio UI
+iface = gr.Interface(
+    fn=query_index,
+    inputs=gr.Textbox(label="question", placeholder="سوال خود را وارد کنید"),
+    outputs=gr.Textbox(label="output"),
+    title="چت‌بات هوشمند تیام",
+    description="سوالات خود درباره خدمات دیجیتال مارکتینگ تیام را بپرسید."
+)
+iface.launch(server_name="0.0.0.0", server_port=7860)