Spaces:

M17idd
/

army

Sleeping

App Files Files Community

M17idd commited on Apr 28

Commit

22563c1

1 Parent(s): 6b3d353

Update app.py

Browse files

Files changed (1) hide show

app.py +61 -0

app.py CHANGED Viewed

@@ -182,6 +182,8 @@ st.markdown('<div class="chat-message">👋 سلام! چطور میتونم کم
 #if user_input:
 #   st.markdown(f'<div class="chat-message">📩 شما: {user_input}</div>', unsafe_allow_html=True)
 # ----------------- لود PDF و ساخت ایندکس -----------------
 class TogetherEmbeddings(Embeddings):
     def __init__(self, model_name: str, api_key: str):
@@ -209,7 +211,66 @@ def get_pdf_index():
         ).from_loaders(loader)
 index = get_pdf_index()
 llm = ChatOpenAI(
     base_url="https://api.together.xyz/v1",
     api_key='0291f33aee03412a47fa5d8e562e515182dcc5d9aac5a7fb5eefdd1759005979',

 #if user_input:
 #   st.markdown(f'<div class="chat-message">📩 شما: {user_input}</div>', unsafe_allow_html=True)
+""""
 # ----------------- لود PDF و ساخت ایندکس -----------------
 class TogetherEmbeddings(Embeddings):
     def __init__(self, model_name: str, api_key: str):
         ).from_loaders(loader)
 index = get_pdf_index()
+"""
+# ----------------- لود csv و ساخت ایندکس -----------------
+class TogetherEmbeddings(Embeddings):
+    def __init__(self, model_name: str, api_key: str):
+        self.model_name = model_name
+        self.client = Together(api_key=api_key)
+    def embed_documents(self, texts: List[str]) -> List[List[float]]:
+        response = self.client.embeddings.create(model=self.model_name, input=texts)
+        return [item.embedding for item in response.data]
+    def embed_query(self, text: str) -> List[float]:
+        return self.embed_documents([text])[0]
+@st.cache_resource
+def get_csv_index(csv_file):
+    with st.spinner('📄 در حال پردازش فایل CSV...'):
+        # خواندن داده‌های CSV
+        df = pd.read_csv(csv_file)
+        # فرض بر این است که شما می‌خواهید ستون خاصی از CSV را برای ایندکس کردن استفاده کنید
+        texts = df['your_column_name'].tolist()  # ستون مورد نظر خود را مشخص کنید
+        # ایجاد embeddings
+        embeddings = TogetherEmbeddings(
+            model_name="togethercomputer/m2-bert-80M-8k-retrieval",
+            api_key="0291f33aee03412a47fa5d8e562e515182dcc5d9aac5a7fb5eefdd1759005979"
+        )
+        # استفاده از VectorstoreIndexCreator برای ساخت ایندکس
+        return VectorstoreIndexCreator(
+            embedding=embeddings,
+            text_splitter=RecursiveCharacterTextSplitter(chunk_size=300, chunk_overlap=0)
+        ).from_documents(texts)
+# مسیر فایل CSV به صورت دستی
+csv_file_path = 'testttt.csv'
+# در اینجا فایل را به صورت دستی می‌خوانیم
+if csv_file_path:
+    csv_index = get_csv_index(csv_file_path)
+    st.success("ایندکس فایل CSV با موفقیت ساخته شد!")
+index = get_csv_index()
+#------------------------------------------
 llm = ChatOpenAI(
     base_url="https://api.together.xyz/v1",
     api_key='0291f33aee03412a47fa5d8e562e515182dcc5d9aac5a7fb5eefdd1759005979',