Spaces:

ramysaidagieb
/

ask1

Build error

App Files Files Community

ramysaidagieb commited on Jun 9

Commit

f30a153

verified ·

1 Parent(s): e3b4042

Update app.py

Browse files

Files changed (1) hide show

app.py +13 -13

app.py CHANGED Viewed

@@ -5,17 +5,17 @@ from sentence_transformers import SentenceTransformer
 import json
 from dspy import Example, MIPROv2, Evaluate, evaluate
-# ✅ إعداد نموذج مفتوح المصدر متاح على Hugging Face
 dspy.settings.configure(lm=dspy.LM("mistralai/Mistral-7B-Instruct-v0.2"))
-# ✅ إعداد Chroma باستخدام الطريقة الحديثة
 client = chromadb.PersistentClient(path="./chroma_db")
 col = client.get_or_create_collection(name="arabic_docs")
-# ✅ نموذج embeddings يدعم العربية
 embedder = SentenceTransformer("sentence-transformers/LaBSE")
-# ⬇️ تقطيع محتوى PDF
 def process_pdf(pdf_bytes):
     doc = fitz.open(stream=pdf_bytes, filetype="pdf")
     texts = []
@@ -26,7 +26,7 @@ def process_pdf(pdf_bytes):
                 texts.append(chunk.strip())
     return texts
-# ⬇️ إضافة المحتوى إلى قاعدة البيانات
 def ingest(pdf_bytes):
     texts = process_pdf(pdf_bytes)
     embeddings = embedder.encode(texts, show_progress_bar=True)
@@ -34,16 +34,16 @@ def ingest(pdf_bytes):
         col.add(ids=[f"chunk_{i}"], embeddings=[emb.tolist()], metadatas=[{"text": chunk}])
     return f"✅ تمت إضافة {len(texts)} مقطعاً."
-# ⬇️ محدد سياق من Chroma
-retriever = dspy.Retrieve(lambda q: [m["text"] for m in col.query(q, n_results=3)["metadatas"]], k=1)
-# 🧠 تعريف توقيع الاستجابة
 class RagSig(dspy.Signature):
     question: str
     context: str
     answer: str
-# وحدة توليد الإجابة من DSPy
 class RagMod(dspy.Module):
     def __init__(self):
         super().__init__()
@@ -55,17 +55,17 @@ class RagMod(dspy.Module):
 model = RagMod()
-# ⬇️ التفاعل الأساسي
 def answer(question):
     out = model(question)
     return out.answer
-# ⬇️ تحميل بيانات التدريب والتقييم
 def load_dataset(path):
     with open(path, "r", encoding="utf-8") as f:
         return [Example(**json.loads(l)).with_inputs("question") for l in f]
-# ⬇️ تحسين النموذج باستخدام MIPROv2
 def optimize(train_file, val_file):
     global model
     trainset = load_dataset(train_file.name)
@@ -75,7 +75,7 @@ def optimize(train_file, val_file):
     model = optimized
     return "✅ تم تحسين النموذج!"
-# 🖼️ واجهة Gradio
 with gr.Blocks() as demo:
     gr.Markdown("## 🧠 نظام RAG عربي باستخدام DSPy + نموذج مفتوح المصدر")

 import json
 from dspy import Example, MIPROv2, Evaluate, evaluate
+# إعداد نموذج مفتوح المصدر من Hugging Face
 dspy.settings.configure(lm=dspy.LM("mistralai/Mistral-7B-Instruct-v0.2"))
+# إعداد Chroma بالطريقة الجديدة
 client = chromadb.PersistentClient(path="./chroma_db")
 col = client.get_or_create_collection(name="arabic_docs")
+# نموذج embeddings يدعم اللغة العربية
 embedder = SentenceTransformer("sentence-transformers/LaBSE")
+# استخراج النصوص من PDF
 def process_pdf(pdf_bytes):
     doc = fitz.open(stream=pdf_bytes, filetype="pdf")
     texts = []
                 texts.append(chunk.strip())
     return texts
+# إدخال البيانات في قاعدة Chroma
 def ingest(pdf_bytes):
     texts = process_pdf(pdf_bytes)
     embeddings = embedder.encode(texts, show_progress_bar=True)
         col.add(ids=[f"chunk_{i}"], embeddings=[emb.tolist()], metadatas=[{"text": chunk}])
     return f"✅ تمت إضافة {len(texts)} مقطعاً."
+# مكون الاسترجاع من Chroma (بلا k)
+retriever = dspy.Retrieve(lambda q: [m["text"] for m in col.query(q, n_results=1)["metadatas"]])
+# توقيع DSPy
 class RagSig(dspy.Signature):
     question: str
     context: str
     answer: str
+# وحدة RAG
 class RagMod(dspy.Module):
     def __init__(self):
         super().__init__()
 model = RagMod()
+# توليد الإجابة
 def answer(question):
     out = model(question)
     return out.answer
+# تحميل بيانات التدريب/التقييم
 def load_dataset(path):
     with open(path, "r", encoding="utf-8") as f:
         return [Example(**json.loads(l)).with_inputs("question") for l in f]
+# تحسين النموذج باستخدام MIPROv2
 def optimize(train_file, val_file):
     global model
     trainset = load_dataset(train_file.name)
     model = optimized
     return "✅ تم تحسين النموذج!"
+# واجهة Gradio
 with gr.Blocks() as demo:
     gr.Markdown("## 🧠 نظام RAG عربي باستخدام DSPy + نموذج مفتوح المصدر")