File size: 1,841 Bytes
9581815
4d9a0e6
 
 
 
 
 
9581815
 
4d9a0e6
9581815
 
dd3daa8
4d9a0e6
dd3daa8
f1e5728
dd3daa8
cd3e0b8
dd3daa8
 
 
 
 
4d9a0e6
dd3daa8
4d9a0e6
dd3daa8
 
 
 
 
4d9a0e6
dd3daa8
4d9a0e6
dd3daa8
4d9a0e6
dd3daa8
f1e5728
dd3daa8
50a43ab
dd3daa8
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
---

title: Pdf 2 Summary
emoji: 🌍
colorFrom: red
colorTo: purple
sdk: streamlit
sdk_version: 1.31.1
app_file: app.py
pinned: false
license: mit
---


# 進階 NLP PDF 條列式重點摘要工具 🚀

本工具可以將冗長的 PDF 文件,透過先進的自然語言處理(NLP)技術,快速轉換為條列式、易讀的重點摘要。以下說明本應用的功能與操作方式,協助教師與學生輕鬆掌握大量資訊。

## 功能特色

- **PDF 文字擷取**:利用 PyPDF2 高效讀取 PDF 內容,確保摘要過程不遺漏任何資料。
- **高級文字前處理**:結合 spaCy 斷詞、詞形還原、去除停用字,讓資料更精煉、更容易分析。
- **關鍵詞擷取**:透過 NLP 技術找出文章最重要的關鍵詞與專有名詞,抓住主題核心。
- **句子重要度評分**:自訂演算法根據關鍵詞分布與語意相關性,挑選出最能代表全文重點的句子。
- **動態摘要調整**:可依需求調整摘要比例,彈性生成長短不一的重點摘要。

## 操作說明

1. **安裝套件**:請先安裝 Python 與必要函式庫(PyPDF2、spaCy、Streamlit)。
2. **啟動應用程式**:在終端機執行 `streamlit run app.py`,依畫面指示開啟網頁介面。
3. **上傳 PDF 檔案**:於網頁上傳欲摘要的 PDF 文件。
4. **調整摘要比例**:用滑桿設定想要的摘要長度比例(%)。
5. **查看條列摘要**:系統自動處理,於下方顯示條列式重點摘要。

## 參與貢獻

本專案採用 MIT 開源授權檔案。

## 授權

本專案採用 MIT 開源授權檔案。

## 致謝

- 感謝 NLP 函式庫
- 感謝 PyPDF2  函式庫
- 感謝 Streamlit 函式庫

感謝您使用本工具,期待能幫助您在學習與工作上更有效率!