Edge_TTS_NGHIA_transcript

Sleeping

cnph001 commited on May 13

Commit

2d5b8e4

verified ·

1 Parent(s): 5e0c245

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,4 +1,4 @@
-##fix overlap
 import spaces
 import gradio as gr
@@ -11,14 +11,21 @@ from pathlib import Path
 from pydub.silence import detect_nonsilent
 from pydub import AudioSegment
-def strip_silence(audio: AudioSegment, silence_thresh=-40, min_silence_len=100):
     from pydub.silence import detect_nonsilent
     nonsilent = detect_nonsilent(audio, min_silence_len=min_silence_len, silence_thresh=silence_thresh)
     if not nonsilent:
-        # No speech found; return empty or silence
-        return AudioSegment.silent(duration=0)
     start_trim = nonsilent[0][0]
     end_trim = nonsilent[-1][1]
     return audio[start_trim:end_trim]

+##fix overlap, remove silence, leave a tiny bit of silence
 import spaces
 import gradio as gr
 from pydub.silence import detect_nonsilent
 from pydub import AudioSegment
+def strip_silence(audio: AudioSegment, silence_thresh=-40, min_silence_len=100, silence_padding_ms=100):
     from pydub.silence import detect_nonsilent
+    # Detect non-silent regions
     nonsilent = detect_nonsilent(audio, min_silence_len=min_silence_len, silence_thresh=silence_thresh)
+    # If no speech is detected, return a small silent audio (not totally empty)
     if not nonsilent:
+        return AudioSegment.silent(duration=silence_padding_ms)
+    # Start and end of the first and last non-silent segments
     start_trim = nonsilent[0][0]
     end_trim = nonsilent[-1][1]
+    # Add padding before and after the trimmed audio
+    # Ensure the padding doesn't exceed the trimmed boundaries
+    start_trim = max(0, start_trim - silence_padding_ms)  # Ensure no negative start
+    end_trim = min(len(audio), end_trim + silence_padding_ms)  # Ensure end doesn't go past audio length
+    # Return the trimmed and padded audio
     return audio[start_trim:end_trim]