Spaces:

camparchimedes
/

nb

Build error

camparchimedes commited on Aug 26, 2024

Commit

3efe0d9

verified ·

1 Parent(s): 5c44de8

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -67,15 +67,18 @@ def convert_to_wav(filepath):
 pipe = pipeline("automatic-speech-recognition", model="NbAiLab/nb-whisper-large", chunk_length_s=30, generate_kwargs={'task': 'transcribe', 'language': 'no'})
 @spaces.GPU()
-def transcribe_audio(audio_file, batch_size=16):
     # --audio file to tensor
-    waveform, sample_rate = torchaudio.load(audio_file)
-    samples = waveform.numpy()
     start_time = time.time()
     # --pipe it
-    outputs = pipe(samples, sampling_rate=sample_rate, batch_size=batch_size, return_timestamps=False)
     text = outputs["text"]
     end_time = time.time()

 pipe = pipeline("automatic-speech-recognition", model="NbAiLab/nb-whisper-large", chunk_length_s=30, generate_kwargs={'task': 'transcribe', 'language': 'no'})
 @spaces.GPU()
+def transcribe_audio(audio_file, batch_size=16, sample_rate =16000):
     # --audio file to tensor
+    waveform = waveform.numpy(audio_file)
+    samples = samples.numpy(audio_file)
+    if waveform.ndim > 1:
+        waveform = waveform[0, :]
+    waveform, samples = torchaudio.load(waveform, samples)
     start_time = time.time()
     # --pipe it
+    outputs = pipe(waveform, samples, sampling_rate=sample_rate, batch_size=batch_size, return_timestamps=False)
     text = outputs["text"]
     end_time = time.time()