Spaces:

Vartex39
/

vizsum-pro

Sleeping

App Files Files Community

Vartex39 commited on May 27

Commit

cc21f11

0 Parent(s):

VIZSUM PRO REAL DEPLOY — Claude 3, Emoji Yok, PDF Fix

Browse files

Files changed (16) hide show

.env.example +1 -0
.gitignore +11 -0
.gradio/certificate.pem +31 -0
README.md +22 -0
app.py +2 -0
git +0 -0
main +0 -0
ocr_engine.py +46 -0
pdf_reader.py +15 -0
requirements.txt +6 -0
summarizer.py +39 -0
summarizer_test.py +6 -0
tests/notepad_test_ocr.py +3 -0
tests/python_test_key.py +6 -0
tests/summarizer_test.py +6 -0
ui.py +54 -0

.env.example ADDED Viewed

	@@ -0,0 +1 @@


1	+ OPENROUTER_API_KEY=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

.gitignore ADDED Viewed

	@@ -0,0 +1,11 @@

+*.png
+*.jpg
+*.jpeg
+*.mp3
+*.mp4
+*.pt
+*.ckpt
+*.bin
+__pycache__/
+*.py[cod]
+.env

.gradio/certificate.pem ADDED Viewed

	@@ -0,0 +1,31 @@

+-----BEGIN CERTIFICATE-----
+MIIFazCCA1OgAwIBAgIRAIIQz7DSQONZRGPgu2OCiwAwDQYJKoZIhvcNAQELBQAw
+TzELMAkGA1UEBhMCVVMxKTAnBgNVBAoTIEludGVybmV0IFNlY3VyaXR5IFJlc2Vh
+cmNoIEdyb3VwMRUwEwYDVQQDEwxJU1JHIFJvb3QgWDEwHhcNMTUwNjA0MTEwNDM4
+WhcNMzUwNjA0MTEwNDM4WjBPMQswCQYDVQQGEwJVUzEpMCcGA1UEChMgSW50ZXJu
+ZXQgU2VjdXJpdHkgUmVzZWFyY2ggR3JvdXAxFTATBgNVBAMTDElTUkcgUm9vdCBY
+MTCCAiIwDQYJKoZIhvcNAQEBBQADggIPADCCAgoCggIBAK3oJHP0FDfzm54rVygc
+h77ct984kIxuPOZXoHj3dcKi/vVqbvYATyjb3miGbESTtrFj/RQSa78f0uoxmyF+
+0TM8ukj13Xnfs7j/EvEhmkvBioZxaUpmZmyPfjxwv60pIgbz5MDmgK7iS4+3mX6U
+A5/TR5d8mUgjU+g4rk8Kb4Mu0UlXjIB0ttov0DiNewNwIRt18jA8+o+u3dpjq+sW
+T8KOEUt+zwvo/7V3LvSye0rgTBIlDHCNAymg4VMk7BPZ7hm/ELNKjD+Jo2FR3qyH
+B5T0Y3HsLuJvW5iB4YlcNHlsdu87kGJ55tukmi8mxdAQ4Q7e2RCOFvu396j3x+UC
+B5iPNgiV5+I3lg02dZ77DnKxHZu8A/lJBdiB3QW0KtZB6awBdpUKD9jf1b0SHzUv
+KBds0pjBqAlkd25HN7rOrFleaJ1/ctaJxQZBKT5ZPt0m9STJEadao0xAH0ahmbWn
+OlFuhjuefXKnEgV4We0+UXgVCwOPjdAvBbI+e0ocS3MFEvzG6uBQE3xDk3SzynTn
+jh8BCNAw1FtxNrQHusEwMFxIt4I7mKZ9YIqioymCzLq9gwQbooMDQaHWBfEbwrbw
+qHyGO0aoSCqI3Haadr8faqU9GY/rOPNk3sgrDQoo//fb4hVC1CLQJ13hef4Y53CI
+rU7m2Ys6xt0nUW7/vGT1M0NPAgMBAAGjQjBAMA4GA1UdDwEB/wQEAwIBBjAPBgNV
+HRMBAf8EBTADAQH/MB0GA1UdDgQWBBR5tFnme7bl5AFzgAiIyBpY9umbbjANBgkq
+hkiG9w0BAQsFAAOCAgEAVR9YqbyyqFDQDLHYGmkgJykIrGF1XIpu+ILlaS/V9lZL
+ubhzEFnTIZd+50xx+7LSYK05qAvqFyFWhfFQDlnrzuBZ6brJFe+GnY+EgPbk6ZGQ
+3BebYhtF8GaV0nxvwuo77x/Py9auJ/GpsMiu/X1+mvoiBOv/2X/qkSsisRcOj/KK
+NFtY2PwByVS5uCbMiogziUwthDyC3+6WVwW6LLv3xLfHTjuCvjHIInNzktHCgKQ5
+ORAzI4JMPJ+GslWYHb4phowim57iaztXOoJwTdwJx4nLCgdNbOhdjsnvzqvHu7Ur
+TkXWStAmzOVyyghqpZXjFaH3pO3JLF+l+/+sKAIuvtd7u+Nxe5AW0wdeRlN8NwdC
+jNPElpzVmbUq4JUagEiuTDkHzsxHpFKVK7q4+63SM1N95R1NbdWhscdCb+ZAJzVc
+oyi3B43njTOQ5yOf+1CceWxG1bQVs5ZufpsMljq4Ui0/1lvh+wjChP4kqKOJ2qxq
+4RgqsahDYVvTH9w7jXbyLeiNdd8XM2w9U/t7y0Ff/9yi0GE44Za4rF2LN9d11TPA
+mRGunUHBcnWEvgJBQl9nJEiU0Zsnvgc/ubhPgXRR4Xq37Z0j4r7g1SgEEzwxA57d
+emyPxgcYxn/eR44/KJ4EBs+lVDR3veyJm+kXQ99b21/+jh5Xos1AnX5iItreGCc=
+-----END CERTIFICATE-----

README.md ADDED Viewed

	@@ -0,0 +1,22 @@

+---
+title: VizSum Pro
+emoji: 📄
+colorFrom: purple
+colorTo: indigo
+sdk: gradio
+sdk_version: 4.19.2
+app_file: app.py
+pinned: false
+---
+# VizSum Pro
+AI-powered summarizer that supports images, PDFs, and manual text.
+- 🔍 OCR (Tesseract) for image text extraction
+- 📄 PDF parser
+- ✍️ Manual input
+- 🎯 Mode selector for different summary styles
+Built with ❤️ using Python + Gradio.

app.py ADDED Viewed

	@@ -0,0 +1,2 @@


1	+ import ui
2	+ ui.demo.launch()

git ADDED Viewed

File without changes

main ADDED Viewed

File without changes

ocr_engine.py ADDED Viewed

	@@ -0,0 +1,46 @@

+import requests
+import os
+from dotenv import load_dotenv
+load_dotenv()
+ocr_api_key = os.getenv("OCR_SPACE_API_KEY")
+def extract_text_from_image(image_path):
+    try:
+        if not isinstance(image_path, str) or not os.path.exists(image_path):
+            return "❌ Geçersiz dosya yolu."
+        with open(image_path, 'rb') as image_file:
+            image_data = image_file.read()
+        response = requests.post(
+            url='https://api.ocr.space/parse/image',
+            files={'file': ('image.png', image_data)},
+            data={
+                'apikey': ocr_api_key.strip(),
+                'language': 'eng',
+                'isOverlayRequired': False,
+                'OCREngine': 2
+            }
+        )
+        # JSON dönüşüm kontrolü
+        try:
+            result = response.json()
+        except Exception:
+            return f"❌ API yanıtı JSON formatında değil:\n{response.text}"
+        if not isinstance(result, dict):
+            return f"❌ API çıktısı sözlük değil:\n{result}"
+        if result.get("IsErroredOnProcessing"):
+            return f"❌ OCR Hatası: {result.get('ErrorMessage', ['Bilinmeyen hata'])[0]}"
+        parsed_results = result.get("ParsedResults")
+        if not parsed_results or not isinstance(parsed_results, list):
+            return "❌ OCR sonucu boş veya biçimsiz."
+        return parsed_results[0].get('ParsedText', '').strip()
+    except Exception as e:
+        return f"❌ Sistemsel Hata: {str(e)}"

pdf_reader.py ADDED Viewed

	@@ -0,0 +1,15 @@

+import fitz  # PyMuPDF
+def extract_text_from_pdf(pdf_input):
+    try:
+        if isinstance(pdf_input, str):
+            doc = fitz.open(pdf_input)
+        else:
+            doc = fitz.open(stream=pdf_input.read(), filetype="pdf")
+        text = "\n".join([page.get_text() for page in doc])
+        doc.close()
+        return text
+    except Exception as e:
+        return f"❌ PDF İşleme Hatası: {str(e)}"

requirements.txt ADDED Viewed

	@@ -0,0 +1,6 @@

+gradio
+pytesseract
+python-dotenv
+requests
+PyMuPDF
+Pillow

summarizer.py ADDED Viewed

	@@ -0,0 +1,39 @@

+import os
+import requests
+from dotenv import load_dotenv
+load_dotenv()
+api_key = os.getenv("OPENROUTER_API_KEY").strip()
+def build_prompt(text, mode):
+    if "Sade" in mode:
+        instruction = "Bu metni herkesin anlayabileceği şekilde sadeleştir."
+    elif "Eleştir" in mode:
+        instruction = "Metni eleştir, eksiklerini ve güçlü yönlerini değerlendir."
+    elif "Başlık" in mode:
+        instruction = "Metne uygun birkaç başlık öner."
+    elif "Not" in mode:
+        instruction = "Metinden önemli notlar çıkar."
+    else:
+        instruction = "Kısa ve teknik bir özet ver."
+    return f"{instruction}\n\nMetin:\n{text}"
+def summarize_text(text, mode):
+    url = "https://openrouter.ai/api/v1/chat/completions"
+    headers = {
+        "Authorization": f"Bearer {api_key}",
+        "Content-Type": "application/json"
+    }
+    data = {
+        "model": "openai/gpt-3.5-turbo",
+        "messages": [
+            {"role": "user", "content": build_prompt(text, mode)}
+        ]
+    }
+    response = requests.post(url, headers=headers, json=data)
+    response.raise_for_status()
+    return response.json()['choices'][0]['message']['content']

summarizer_test.py ADDED Viewed

	@@ -0,0 +1,6 @@

+from summarizer import summarize_text
+text = "Tokenization, metni daha küçük parçalara ayırma işlemidir."
+mode = "📘 Teknik Özet"  # Varsayılan modlardan biri
+print(summarize_text(text, mode))

tests/notepad_test_ocr.py ADDED Viewed

	@@ -0,0 +1,3 @@


1	+ from ocr_engine import extract_text_from_image
2	+
3	+ print(extract_text_from_image("c:/Users/sinan/Desktop/vizsum-pro/test.png"))

tests/python_test_key.py ADDED Viewed

	@@ -0,0 +1,6 @@

+import os
+from dotenv import load_dotenv
+load_dotenv()
+key = os.getenv("OCR_SPACE_API_KEY")
+print(f"KEY: '{key}'")

tests/summarizer_test.py ADDED Viewed

	@@ -0,0 +1,6 @@

+from summarizer import summarize_text
+text = "Tokenization, metni daha küçük parçalara ayırma işlemidir."
+mode = "📘 Teknik Özet"  # Varsayılan modlardan biri
+print(summarize_text(text, mode))

ui.py ADDED Viewed

	@@ -0,0 +1,54 @@

+import gradio as gr
+from ocr_engine import extract_text_from_image
+from pdf_reader import extract_text_from_pdf
+from summarizer import summarize_text
+def process_input(pdf, image, manual_text, mode):
+    if pdf is not None:
+        text = extract_text_from_pdf(pdf)
+    elif image is not None:
+        text = extract_text_from_image(image)
+    elif manual_text.strip() != "":
+        text = manual_text
+    else:
+        return "Lütfen bir giriş türü seçin.", ""
+    summary = summarize_text(text, mode)
+    return text, summary
+with gr.Blocks() as demo:
+    gr.Markdown("## 📚 VizSum Pro+: AI Destekli Özetleyici")
+    with gr.Row():
+        pdf_input = gr.File(label="📄 PDF Yükle", file_types=[".pdf"])
+        image_input = gr.Image(type="filepath", label="🖼️ Görsel Yükle")
+    manual_input = gr.Textbox(lines=5, label="✍️ Metni Manuel Gir")
+    # BURAYA AL
+    mode_selector = gr.Dropdown(
+        choices=["📘 Teknik Özet", "🧒 Sade Anlatım", "🧠 Eleştir ve Değerlendir", "📝 Başlık Çıkar", "📎 Not Formatı"],
+        label="🧩 Özetleme Modu",
+        value="📘 Teknik Özet"
+    )
+    with gr.Row():
+        submit_btn = gr.Button("Özetle")
+    with gr.Row():
+        text_output = gr.Textbox(label="📜 Metin")
+        summary_output = gr.Textbox(label="🧠 AI Özeti")
+    # EN SONDA KALACAK
+    submit_btn.click(
+        fn=process_input,
+        inputs=[pdf_input, image_input, manual_input, mode_selector],
+        outputs=[text_output, summary_output]
+    )
+if __name__ == "__main__":
+    demo.launch(share=True)