Spaces:
Sleeping
Sleeping
File size: 1,841 Bytes
9581815 4d9a0e6 9581815 4d9a0e6 9581815 dd3daa8 4d9a0e6 dd3daa8 f1e5728 dd3daa8 cd3e0b8 dd3daa8 4d9a0e6 dd3daa8 4d9a0e6 dd3daa8 4d9a0e6 dd3daa8 4d9a0e6 dd3daa8 4d9a0e6 dd3daa8 f1e5728 dd3daa8 50a43ab dd3daa8 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 |
---
title: Pdf 2 Summary
emoji: 🌍
colorFrom: red
colorTo: purple
sdk: streamlit
sdk_version: 1.31.1
app_file: app.py
pinned: false
license: mit
---
# 進階 NLP PDF 條列式重點摘要工具 🚀
本工具可以將冗長的 PDF 文件,透過先進的自然語言處理(NLP)技術,快速轉換為條列式、易讀的重點摘要。以下說明本應用的功能與操作方式,協助教師與學生輕鬆掌握大量資訊。
## 功能特色
- **PDF 文字擷取**:利用 PyPDF2 高效讀取 PDF 內容,確保摘要過程不遺漏任何資料。
- **高級文字前處理**:結合 spaCy 斷詞、詞形還原、去除停用字,讓資料更精煉、更容易分析。
- **關鍵詞擷取**:透過 NLP 技術找出文章最重要的關鍵詞與專有名詞,抓住主題核心。
- **句子重要度評分**:自訂演算法根據關鍵詞分布與語意相關性,挑選出最能代表全文重點的句子。
- **動態摘要調整**:可依需求調整摘要比例,彈性生成長短不一的重點摘要。
## 操作說明
1. **安裝套件**:請先安裝 Python 與必要函式庫(PyPDF2、spaCy、Streamlit)。
2. **啟動應用程式**:在終端機執行 `streamlit run app.py`,依畫面指示開啟網頁介面。
3. **上傳 PDF 檔案**:於網頁上傳欲摘要的 PDF 文件。
4. **調整摘要比例**:用滑桿設定想要的摘要長度比例(%)。
5. **查看條列摘要**:系統自動處理,於下方顯示條列式重點摘要。
## 參與貢獻
本專案採用 MIT 開源授權檔案。
## 授權
本專案採用 MIT 開源授權檔案。
## 致謝
- 感謝 NLP 函式庫
- 感謝 PyPDF2 函式庫
- 感謝 Streamlit 函式庫
感謝您使用本工具,期待能幫助您在學習與工作上更有效率!
|