--- title: Pdf 2 Summary emoji: 🌍 colorFrom: red colorTo: purple sdk: streamlit sdk_version: 1.31.1 app_file: app.py pinned: false license: mit --- # 進階 NLP PDF 條列式重點摘要工具 🚀 本工具可以將冗長的 PDF 文件,透過先進的自然語言處理(NLP)技術,快速轉換為條列式、易讀的重點摘要。以下說明本應用的功能與操作方式,協助教師與學生輕鬆掌握大量資訊。 ## 功能特色 - **PDF 文字擷取**:利用 PyPDF2 高效讀取 PDF 內容,確保摘要過程不遺漏任何資料。 - **高級文字前處理**:結合 spaCy 斷詞、詞形還原、去除停用字,讓資料更精煉、更容易分析。 - **關鍵詞擷取**:透過 NLP 技術找出文章最重要的關鍵詞與專有名詞,抓住主題核心。 - **句子重要度評分**:自訂演算法根據關鍵詞分布與語意相關性,挑選出最能代表全文重點的句子。 - **動態摘要調整**:可依需求調整摘要比例,彈性生成長短不一的重點摘要。 ## 操作說明 1. **安裝套件**:請先安裝 Python 與必要函式庫(PyPDF2、spaCy、Streamlit)。 2. **啟動應用程式**:在終端機執行 `streamlit run app.py`,依畫面指示開啟網頁介面。 3. **上傳 PDF 檔案**:於網頁上傳欲摘要的 PDF 文件。 4. **調整摘要比例**:用滑桿設定想要的摘要長度比例(%)。 5. **查看條列摘要**:系統自動處理,於下方顯示條列式重點摘要。 ## 參與貢獻 本專案採用 MIT 開源授權檔案。 ## 授權 本專案採用 MIT 開源授權檔案。 ## 致謝 - 感謝 NLP 函式庫 - 感謝 PyPDF2 函式庫 - 感謝 Streamlit 函式庫 感謝您使用本工具,期待能幫助您在學習與工作上更有效率!