Spaces:

MicroHealth
/

AV-to-transcripts

Paused

bluenevus commited on Apr 23

Commit

b9e0aa5

verified ·

1 Parent(s): 836768f

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -87,6 +87,9 @@ def format_transcript_with_speakers(transcript, diarization):
 def transcribe_audio(audio_file, pipeline):
     try:
         print("Loading audio file...")
         audio_input, sr = librosa.load(audio_file, sr=16000)
         audio_input = audio_input.astype(np.float32)
@@ -188,6 +191,8 @@ def update_transcription(n_clicks, hf_token, url):
         try:
             # Initialize the speaker diarization pipeline with the provided token
             pipeline = Pipeline.from_pretrained("pyannote/speaker-diarization", use_auth_token=hf_token)
             print("Speaker diarization pipeline initialized successfully")
             transcript = transcribe_video(url, pipeline)
@@ -200,7 +205,7 @@ def update_transcription(n_clicks, hf_token, url):
     thread.start()
     thread.join()
-    transcript = transcribe()
     if transcript and not transcript.startswith("An error occurred"):
         download_data = dict(content=transcript, filename="transcript.txt")
@@ -212,7 +217,4 @@ def update_transcription(n_clicks, hf_token, url):
             ])
         ]), download_data
     else:
-        return transcript, None
-if __name__ == '__main__':
-    app.run(debug=True, host='0.0.0.0', port=7860)

 def transcribe_audio(audio_file, pipeline):
     try:
+        if pipeline is None:
+            raise ValueError("Speaker diarization pipeline is not initialized")
         print("Loading audio file...")
         audio_input, sr = librosa.load(audio_file, sr=16000)
         audio_input = audio_input.astype(np.float32)
         try:
             # Initialize the speaker diarization pipeline with the provided token
             pipeline = Pipeline.from_pretrained("pyannote/speaker-diarization", use_auth_token=hf_token)
+            if pipeline is None:
+                raise ValueError("Failed to initialize the speaker diarization pipeline")
             print("Speaker diarization pipeline initialized successfully")
             transcript = transcribe_video(url, pipeline)
     thread.start()
     thread.join()
+    transcript = thread.result if hasattr(thread, 'result') else "Transcription failed"
     if transcript and not transcript.startswith("An error occurred"):
         download_data = dict(content=transcript, filename="transcript.txt")
             ])
         ]), download_data
     else:
+        return transcript, None