Spaces:

diginoron
/

caspianthesis

Running

App Files Files Community

diginoron commited on Apr 12

Commit

0c0559d

verified ·

1 Parent(s): effcdd9

Update app.py

Browse files

Files changed (1) hide show

app.py +29 -33

app.py CHANGED Viewed

@@ -1,55 +1,51 @@
 import os
-import re
 import gradio as gr
-from transformers import pipeline
-# گرفتن توکن از متغیر محیطی
 token = os.environ.get("HF_TOKEN")
-# استفاده از مدل نسبتاً سبک و قابل اجرا در Hugging Face Spaces
-pipe = pipeline(
     "text-generation",
-    model="google/gemma-2b-it",
     token=token
 )
-# تابع تشخیص و ترجمه کلمات انگلیسی رایج در حوزه روانشناسی
-EN_FA_DICT = {
-    "behavior": "رفتار",
-    "self-esteem": "عزت نفس",
-    "confidence": "اعتماد به نفس",
-    "learning": "یادگیری",
-    "attachment": "دلبستگی",
-    "communication": "ارتباط",
-    "stress": "استرس",
-    "parent": "والد",
-    "trauma": "آسیب روانی"
-}
-def replace_english_words(text):
-    for eng, fa in EN_FA_DICT.items():
-        text = re.sub(rf"\b{eng}\b", fa, text, flags=re.IGNORECASE)
-    return text
 def generate_topics(field, major, keywords, audience, level):
     prompt = f"""
-۳ موضوع پایان‌نامه در رشته {field} با گرایش {major} پیشنهاد بده که به کلیدواژه‌های "{keywords}" مربوط باشه و جامعه هدف آن "{audience}" باشد. مقطع: {level}.
-موضوعات را فارسی بنویس.
 """
-    output = pipe(prompt, max_new_tokens=250)[0]['generated_text']
-    # حذف prompt در صورتی که مدل آن را تکرار کرده باشد
-    if output.startswith(prompt.strip()):
-        output = output[len(prompt.strip()):].strip()
-    # حذف فاصله‌های اضافی و جایگزینی کلمات انگلیسی
-    output = replace_english_words(output.strip())
-    # افزودن پیام پایانی تبلیغاتی
-    output += "\n\nبرای مشاوره و راهنمایی تخصصی با گروه مشاوره کاسپین تماس بگیرید:\n02188252497"
-    return output
 iface = gr.Interface(
     fn=generate_topics,
     inputs=[

 import os
 import gradio as gr
+from transformers import pipeline, MarianMTModel, MarianTokenizer
+# گرفتن توکن از متغیر محیطی (برای Hugging Face API اگر نیاز بود)
 token = os.environ.get("HF_TOKEN")
+# ⬇️ مدل تولید متن انگلیسی (پیشنهاد موضوع)
+text_gen = pipeline(
     "text-generation",
+    model="google/gemma-2b-it",  # نسخه سبک و سازگار
     token=token
 )
+# ⬇️ مدل ترجمه انگلیسی به فارسی
+translation_model_name = "Helsinki-NLP/opus-mt-en-fa"
+translator_tokenizer = MarianTokenizer.from_pretrained(translation_model_name)
+translator_model = MarianMTModel.from_pretrained(translation_model_name)
+def translate_to_persian(text):
+    inputs = translator_tokenizer(text, return_tensors="pt", padding=True, truncation=True)
+    translated = translator_model.generate(**inputs)
+    return translator_tokenizer.decode(translated[0], skip_special_tokens=True)
 def generate_topics(field, major, keywords, audience, level):
+    # ساخت پرامپت برای مدل انگلیسی
     prompt = f"""
+Suggest 3 thesis topics in the field of {field}, with a specialization in {major},
+related to the keywords "{keywords}", and targeting the audience "{audience}".
+The academic level is {level}. Just list the topics briefly.
 """
+    # تولید متن توسط مدل زبان
+    raw_output = text_gen(prompt, max_new_tokens=250)[0]['generated_text']
+    # حذف متن prompt تکراری (اگر مدل تکرار کرد)
+    if raw_output.startswith(prompt.strip()):
+        raw_output = raw_output[len(prompt.strip()):].strip()
+    # ترجمه خروجی به فارسی
+    translated_output = translate_to_persian(raw_output.strip())
+    # افزودن پیام تبلیغاتی در پایان
+    final_output = translated_output + "\n\nبرای مشاوره و راهنمایی تخصصی با گروه مشاوره کاسپین تماس بگیرید:\n02188252497"
+    return final_output
+# رابط Gradio
 iface = gr.Interface(
     fn=generate_topics,
     inputs=[