Edge_TTS_NGHIA_transcript

Sleeping

App Files Files Community

cnph001 commited on May 17

Commit

08f8e97

verified ·

1 Parent(s): 7941061

Update app.py

Browse files

Files changed (1) hide show

app.py +5 -3

app.py CHANGED Viewed

@@ -16,7 +16,7 @@ from pydub import AudioSegment
 default_voice_short= ""
 check1 = False  # set global variable to check to see if process_text is begin of transcript line or not.
-def strip_silence(audio: AudioSegment, silence_thresh=-40, min_silence_len=100, silence_padding_ms=50):
     from pydub.silence import detect_nonsilent
     # Detect non-silent regions
     nonsilent = detect_nonsilent(audio, min_silence_len=min_silence_len, silence_thresh=silence_thresh)
@@ -29,6 +29,8 @@ def strip_silence(audio: AudioSegment, silence_thresh=-40, min_silence_len=100,
     # Add padding before and after the trimmed audio
     # Ensure the padding doesn't exceed the trimmed boundaries
     start_trim = max(0, start_trim - silence_padding_ms)  # Ensure no negative start
     end_trim = min(len(audio), end_trim + silence_padding_ms)  # Ensure end doesn't go past audio length
     # Return the trimmed and padded audio
     return audio[start_trim:end_trim]
@@ -136,9 +138,9 @@ async def generate_audio_with_voice_prefix(text_segment, default_voice, rate, pi
                 audio = AudioSegment.from_mp3(audio_path)
                 if check1:
                     print(f"First part of sentence - long silence")
-                    audio = strip_silence(audio, silence_thresh=-40, min_silence_len=100)  ##silence between sentences
                 else:
-                    audio = strip_silence(audio, silence_thresh=-40, min_silence_len=100)  ##less silence for mid-sentence segments
                     print(f"2nd part of sentence - long silence")
                 stripped_path = tempfile.mktemp(suffix=".mp3")
                 audio.export(stripped_path, format="mp3")

 default_voice_short= ""
 check1 = False  # set global variable to check to see if process_text is begin of transcript line or not.
+def strip_silence(audio: AudioSegment, silence_thresh=-40, min_silence_len=100, silence_padding_ms=100):
     from pydub.silence import detect_nonsilent
     # Detect non-silent regions
     nonsilent = detect_nonsilent(audio, min_silence_len=min_silence_len, silence_thresh=silence_thresh)
     # Add padding before and after the trimmed audio
     # Ensure the padding doesn't exceed the trimmed boundaries
     start_trim = max(0, start_trim - silence_padding_ms)  # Ensure no negative start
+    #if not check1:
+    #    silence_padding_ms=30
     end_trim = min(len(audio), end_trim + silence_padding_ms)  # Ensure end doesn't go past audio length
     # Return the trimmed and padded audio
     return audio[start_trim:end_trim]
                 audio = AudioSegment.from_mp3(audio_path)
                 if check1:
                     print(f"First part of sentence - long silence")
+                    audio = strip_silence(audio, silence_thresh=-40, min_silence_len=50, silence_padding_ms=50)  ##silence between sentences
                 else:
+                    audio = strip_silence(audio, silence_thresh=-40, min_silence_len=50, silence_padding_ms=20)  ##less silence for mid-sentence segments
                     print(f"2nd part of sentence - long silence")
                 stripped_path = tempfile.mktemp(suffix=".mp3")
                 audio.export(stripped_path, format="mp3")