Spaces:

M17idd
/

army

Sleeping

M17idd commited on May 4

Commit

b141134

1 Parent(s): 2b4036c

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -535,28 +535,28 @@ def load_and_process_documents(path):
 # بارگذاری و پردازش اسناد
 all_sentences = load_and_process_documents(folder_path)
-# تابع خلاصه‌سازی متن با استفاده از KMeans
-def summarize_text_with_kmeans(text, num_sentences=3):
-    sentences = sentence_tokenizer.tokenize(text)  # تقسیم متن به جملات
-    tfidf_vectorizer = TfidfVectorizer()
-    tfidf_matrix = tfidf_vectorizer.fit_transform(sentences)  # تبدیل جملات به ماتریس TF-IDF
-    # الگوریتم خوشه‌بندی KMeans
-    kmeans = KMeans(n_clusters=1)  # یک خوشه برای استخراج خلاصه
-    kmeans.fit(tfidf_matrix)
-    # پیدا کردن جملات نزدیک به مرکز خوشه
-    closest_centroid = kmeans.cluster_centers_[0]
-    similarities = cosine_similarity(tfidf_matrix, closest_centroid.reshape(1, -1))
-    similar_sentences_indices = similarities.flatten().argsort()[-num_sentences:][::-1]  # انتخاب jملات نزدیک
-    summary = [sentences[i] for i in similar_sentences_indices]
-    return ' '.join(summary)
-    # خلاصه‌سازی متن قبل از ارسال به LLM
-text_to_summarize = "\n".join(all_sentences)  # تمام جملات را با هم ترکیب کنید
-summarized_text = summarize_text_with_kmeans(text_to_summarize)
 # تابع تمیز کردن متن
 def clean_text(text):

 # بارگذاری و پردازش اسناد
 all_sentences = load_and_process_documents(folder_path)
+# # تابع خلاصه‌سازی متن با استفاده از KMeans
+# def summarize_text_with_kmeans(text, num_sentences=3):
+#     sentences = sentence_tokenizer.tokenize(text)  # تقسیم متن به جملات
+#     tfidf_vectorizer = TfidfVectorizer()
+#     tfidf_matrix = tfidf_vectorizer.fit_transform(sentences)  # تبدیل جملات به ماتریس TF-IDF
+#     # الگوریتم خوشه‌بندی KMeans
+#     kmeans = KMeans(n_clusters=1)  # یک خوشه برای استخراج خلاصه
+#     kmeans.fit(tfidf_matrix)
+#     # پیدا کردن جملات نزدیک به مرکز خوشه
+#     closest_centroid = kmeans.cluster_centers_[0]
+#     similarities = cosine_similarity(tfidf_matrix, closest_centroid.reshape(1, -1))
+#     similar_sentences_indices = similarities.flatten().argsort()[-num_sentences:][::-1]  # انتخاب jملات نزدیک
+#     summary = [sentences[i] for i in similar_sentences_indices]
+#     return ' '.join(summary)
+#     # خلاصه‌سازی متن قبل از ارسال به LLM
+# text_to_summarize = "\n".join(all_sentences)  # تمام جملات را با هم ترکیب کنید
+summarized_text = all_sentences
 # تابع تمیز کردن متن
 def clean_text(text):