pdf-summarizer-app / README.md
3a05chatgpt's picture
Upload 5 files
dd3daa8 verified

A newer version of the Streamlit SDK is available: 1.46.1

Upgrade
metadata
title: Pdf 2 Summary
emoji: 🌍
colorFrom: red
colorTo: purple
sdk: streamlit
sdk_version: 1.31.1
app_file: app.py
pinned: false
license: mit

進階 NLP PDF 條列式重點摘要工具 🚀

本工具可以將冗長的 PDF 文件,透過先進的自然語言處理(NLP)技術,快速轉換為條列式、易讀的重點摘要。以下說明本應用的功能與操作方式,協助教師與學生輕鬆掌握大量資訊。

功能特色

  • PDF 文字擷取:利用 PyPDF2 高效讀取 PDF 內容,確保摘要過程不遺漏任何資料。
  • 高級文字前處理:結合 spaCy 斷詞、詞形還原、去除停用字,讓資料更精煉、更容易分析。
  • 關鍵詞擷取:透過 NLP 技術找出文章最重要的關鍵詞與專有名詞,抓住主題核心。
  • 句子重要度評分:自訂演算法根據關鍵詞分布與語意相關性,挑選出最能代表全文重點的句子。
  • 動態摘要調整:可依需求調整摘要比例,彈性生成長短不一的重點摘要。

操作說明

  1. 安裝套件:請先安裝 Python 與必要函式庫(PyPDF2、spaCy、Streamlit)。
  2. 啟動應用程式:在終端機執行 streamlit run app.py,依畫面指示開啟網頁介面。
  3. 上傳 PDF 檔案:於網頁上傳欲摘要的 PDF 文件。
  4. 調整摘要比例:用滑桿設定想要的摘要長度比例(%)。
  5. 查看條列摘要:系統自動處理,於下方顯示條列式重點摘要。

參與貢獻

本專案採用 MIT 開源授權檔案。

授權

本專案採用 MIT 開源授權檔案。

致謝

  • 感謝 NLP 函式庫
  • 感謝 PyPDF2 函式庫
  • 感謝 Streamlit 函式庫

感謝您使用本工具,期待能幫助您在學習與工作上更有效率!