Spaces:

PuristanLabs1
/

VocalWeb

Sleeping

App Files Files Community

PuristanLabs1 commited on Mar 12

Commit

207f92d

verified ·

1 Parent(s): d2c615b

Update app.py

Browse files

Files changed (1) hide show

app.py +13 -8

app.py CHANGED Viewed

@@ -66,6 +66,9 @@ def fetch_and_display_content(url):
         text = extract(downloaded, output_format="markdown", with_metadata=True, include_tables=False, include_links=False, include_formatting=True, include_comments=False) #without metadata extraction
     metadata, cleaned_text = extract_and_clean_text(text)
     detected_lang = detect_language(cleaned_text)
     # Add detected language to metadata
     metadata["Detected Language"] = detected_lang.upper()
@@ -300,13 +303,13 @@ with gr.Blocks() as demo:
     url_input = gr.Textbox(label="Enter URL", placeholder="https://example.com/article")
     voice_selection = gr.Dropdown(AVAILABLE_VOICES, label="Select Voice", value="af_bella")
     with gr.Row():
         process_text_button = gr.Button("Fetch Text & Detect Language",scale = 1)
-        process_summary_button = gr.Button("Summarize Text", visible=False,scale = 1)
         process_audio_button = gr.Button("Generate Audio", visible=False,scale = 1)
         process_ner_button = gr.Button("Extract Entities", visible=False,scale = 1)  # ✅ New button for NER
-    # Layout: Two adjacent columns (Text and Metadata)
     with gr.Row():
         extracted_text = gr.Textbox(label="Extracted Content", visible=False, interactive=False, lines=15)
         metadata_output = gr.JSON(label="Article Metadata", visible=False)  # Displays metadata
@@ -317,7 +320,7 @@ with gr.Blocks() as demo:
     summary_output = gr.Textbox(label="Summary", visible=True, interactive=False)
     full_audio_output = gr.Audio(label="Generated Audio", visible=True)
     ner_output = gr.Textbox(label="Extracted Entities", visible=True, interactive=False)
-    #wordcloud_output = gr.Image(label="Word Cloud", visible=True)
 	#Add textboxes for default and custom entity types
     default_entity_types = gr.Textbox(label="Default Entity Types", value="PERSON, Organization, location, Date, PRODUCT, EVENT", interactive=True)
@@ -328,7 +331,7 @@ with gr.Blocks() as demo:
         fetch_and_display_content,
         inputs=[url_input],
-        outputs=[extracted_text, metadata_output, detected_lang, process_summary_button, process_audio_button,process_ner_button, extracted_text, metadata_output]
     )
 	# Automatically generate word cloud when extracted_text changes
@@ -339,12 +342,14 @@ with gr.Blocks() as demo:
         show_progress=True
     )
-    process_summary_button.click(hierarchical_summarization, inputs=[extracted_text], outputs=[summary_output])
     # Step 2: Generate Audio After Text & Language Are Displayed
-    process_audio_button.click(
-        generate_audio_kokoro,
-        inputs=[extracted_text, detected_lang, voice_selection],
         outputs=[full_audio_output]
     )

         text = extract(downloaded, output_format="markdown", with_metadata=True, include_tables=False, include_links=False, include_formatting=True, include_comments=False) #without metadata extraction
     metadata, cleaned_text = extract_and_clean_text(text)
     detected_lang = detect_language(cleaned_text)
+	# Generate Summary Automatically
+    summary_text = hierarchical_summarization(cleaned_text)
     # Add detected language to metadata
     metadata["Detected Language"] = detected_lang.upper()
     url_input = gr.Textbox(label="Enter URL", placeholder="https://example.com/article")
     voice_selection = gr.Dropdown(AVAILABLE_VOICES, label="Select Voice", value="af_bella")
+	tts_option = gr.Radio(["Summary Audio", "Raw Data Audio"], value="Summary Audio", label="Select TTS Source")
     with gr.Row():
         process_text_button = gr.Button("Fetch Text & Detect Language",scale = 1)
         process_audio_button = gr.Button("Generate Audio", visible=False,scale = 1)
         process_ner_button = gr.Button("Extract Entities", visible=False,scale = 1)  # ✅ New button for NER
     with gr.Row():
         extracted_text = gr.Textbox(label="Extracted Content", visible=False, interactive=False, lines=15)
         metadata_output = gr.JSON(label="Article Metadata", visible=False)  # Displays metadata
     summary_output = gr.Textbox(label="Summary", visible=True, interactive=False)
     full_audio_output = gr.Audio(label="Generated Audio", visible=True)
     ner_output = gr.Textbox(label="Extracted Entities", visible=True, interactive=False)
 	#Add textboxes for default and custom entity types
     default_entity_types = gr.Textbox(label="Default Entity Types", value="PERSON, Organization, location, Date, PRODUCT, EVENT", interactive=True)
         fetch_and_display_content,
         inputs=[url_input],
+        outputs=[extracted_text, metadata_output, detected_lang, summary_output, process_audio_button,process_ner_button, extracted_text, metadata_output]
     )
 	# Automatically generate word cloud when extracted_text changes
         show_progress=True
     )
+    #process_summary_button.click(hierarchical_summarization, inputs=[extracted_text], outputs=[summary_output])
     # Step 2: Generate Audio After Text & Language Are Displayed
+   	process_audio_button.click(
+        lambda text, summary, lang, voice, tts_choice: generate_audio_kokoro(
+            summary if tts_choice == "Summary Audio" else text, lang, voice
+        ),
+        inputs=[extracted_text, summary_output, detected_lang, voice_selection, tts_option],
         outputs=[full_audio_output]
     )