Spaces:

sadeghsam
/

chatsummarization

Sleeping

App Files Files Community

sadeghsam commited on Apr 9

Commit

08b2ff1

verified ·

1 Parent(s): 166a074

Update app.py

Browse files

Files changed (1) hide show

app.py +15 -19

app.py CHANGED Viewed

@@ -2,44 +2,40 @@ import gradio as gr
 from transformers import pipeline
 import pandas as pd
-# تعریف pipeline‌های خلاصه‌سازی و برچسب‌گذاری
-summarizer = pipeline("summarization", model="facebook/bart-large-cnn")
-classifier = pipeline("zero-shot-classification", model="facebook/bart-large-mnli")
-# لیست برچسب‌های پیشنهادی (می‌توانید برچسب‌های دلخواه خودتان را تعریف کنید)
-candidate_labels = ["فنی", "مالی", "پشتیبانی", "سایر"]
 def process_chats(file_obj):
-    # خواندن فایل CSV (فایل ورودی باید ستونی به نام 'chat' داشته باشد)
     df = pd.read_csv(file_obj)
     summaries = []
     tags = []
     for chat in df['chat']:
-        # تولید خلاصه از متن چت
-        summary_text = summarizer(chat, max_length=130, min_length=30, do_sample=False)[0]['summary_text']
-        # برچسب‌گذاری چت با استفاده از zero-shot classification
-        classification = classifier(chat, candidate_labels)
-        top_label = classification['labels'][0]
         summaries.append(summary_text)
-        tags.append(top_label)
-    # اضافه کردن خلاصه و برچسب به DataFrame
     df['خلاصه'] = summaries
     df['برچسب'] = tags
-    # خروجی نهایی به صورت یک فایل CSV
     return df.to_csv(index=False)
-# ایجاد رابط کاربری Gradio
 iface = gr.Interface(
     fn=process_chats,
     inputs=gr.File(label="آپلود فایل چت (CSV با ستون 'chat')"),
     outputs="file",
-    title="خلاصه‌سازی و برچسب‌گذاری چت‌های پشتیبانی",
-    description="فایل چت‌های پشتیبانی را آپلود کنید تا برای هر چت یک خلاصه و برچسب استخراج شود."
 )
 iface.launch()

 from transformers import pipeline
 import pandas as pd
+# استفاده از مدل ParsT5 برای تولید خلاصه متون فارسی
+summarizer = pipeline("text2text-generation", model="HooshvareLab/parsT5-base")
+# استفاده از مدل ParsBERT برای دسته‌بندی (برچسب‌گذاری) متن فارسی
+classifier = pipeline("text-classification", model="HooshvareLab/bert-base-parsbert-uncased")
 def process_chats(file_obj):
+    # خواندن فایل CSV؛ فرض شده ستون 'chat' شامل متن هر چت است.
     df = pd.read_csv(file_obj)
     summaries = []
     tags = []
     for chat in df['chat']:
+        # افزودن پیشوند برای روشن کردن وظیفه خلاصه‌سازی به مدل
+        sum_input = "خلاصه کن: " + chat
+        summary_text = summarizer(sum_input, max_length=130, min_length=30, do_sample=False)[0]['generated_text']
+        # دسته‌بندی متن برای اختصاص برچسب
+        classification = classifier(chat)
+        tag = classification[0]['label']
         summaries.append(summary_text)
+        tags.append(tag)
     df['خلاصه'] = summaries
     df['برچسب'] = tags
+    # برگرداندن خروجی به صورت فایل CSV
     return df.to_csv(index=False)
 iface = gr.Interface(
     fn=process_chats,
     inputs=gr.File(label="آپلود فایل چت (CSV با ستون 'chat')"),
     outputs="file",
+    title="خلاصه‌سازی و برچسب‌گذاری چت‌های پشتیبانی به زبان فارسی",
+    description="با آپلود فایل چت (CSV) که شامل ستون 'chat' است، یک نسخه خلاصه‌شده و برچسب‌خورده از چت‌ها دریافت کنید."
 )
 iface.launch()