Spaces:
Sleeping
Sleeping
A newer version of the Streamlit SDK is available:
1.46.1
metadata
title: Pdf 2 Summary
emoji: 🌍
colorFrom: red
colorTo: purple
sdk: streamlit
sdk_version: 1.31.1
app_file: app.py
pinned: false
license: mit
進階 NLP PDF 條列式重點摘要工具 🚀
本工具可以將冗長的 PDF 文件,透過先進的自然語言處理(NLP)技術,快速轉換為條列式、易讀的重點摘要。以下說明本應用的功能與操作方式,協助教師與學生輕鬆掌握大量資訊。
功能特色
- PDF 文字擷取:利用 PyPDF2 高效讀取 PDF 內容,確保摘要過程不遺漏任何資料。
- 高級文字前處理:結合 spaCy 斷詞、詞形還原、去除停用字,讓資料更精煉、更容易分析。
- 關鍵詞擷取:透過 NLP 技術找出文章最重要的關鍵詞與專有名詞,抓住主題核心。
- 句子重要度評分:自訂演算法根據關鍵詞分布與語意相關性,挑選出最能代表全文重點的句子。
- 動態摘要調整:可依需求調整摘要比例,彈性生成長短不一的重點摘要。
操作說明
- 安裝套件:請先安裝 Python 與必要函式庫(PyPDF2、spaCy、Streamlit)。
- 啟動應用程式:在終端機執行
streamlit run app.py
,依畫面指示開啟網頁介面。 - 上傳 PDF 檔案:於網頁上傳欲摘要的 PDF 文件。
- 調整摘要比例:用滑桿設定想要的摘要長度比例(%)。
- 查看條列摘要:系統自動處理,於下方顯示條列式重點摘要。
參與貢獻
本專案採用 MIT 開源授權檔案。
授權
本專案採用 MIT 開源授權檔案。
致謝
- 感謝 NLP 函式庫
- 感謝 PyPDF2 函式庫
- 感謝 Streamlit 函式庫
感謝您使用本工具,期待能幫助您在學習與工作上更有效率!