Update app.py
Browse files
app.py
CHANGED
@@ -542,12 +542,10 @@ st.markdown("""
|
|
542 |
import string
|
543 |
from hazm import word_tokenize
|
544 |
|
545 |
-
# تابع برای استخراج کلمات کلیدی با استفاده از hazm و بدون حذف stopwords
|
546 |
def extract_keywords(query):
|
547 |
-
tokenizer = WordTokenizer(
|
548 |
words = tokenizer.tokenize(query)
|
549 |
|
550 |
-
# حذف علائم نگارشی و فیلتر فقط روی کلمات
|
551 |
keywords = [word for word in words if word not in string.punctuation]
|
552 |
return keywords
|
553 |
|
|
|
542 |
import string
|
543 |
from hazm import word_tokenize
|
544 |
|
|
|
545 |
def extract_keywords(query):
|
546 |
+
tokenizer = WordTokenizer()
|
547 |
words = tokenizer.tokenize(query)
|
548 |
|
|
|
549 |
keywords = [word for word in words if word not in string.punctuation]
|
550 |
return keywords
|
551 |
|