Spaces:

MusIre
/

practiceAI

Sleeping

MusIre commited on Nov 27, 2023

Commit

9802090

1 Parent(s): 0cb2f0c

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -25,6 +25,8 @@ def preprocess_audio(audio_data, sampling_rate=16_000):
 def transcribe_audio(audio_data):
     input_features = preprocess_audio(audio_data)
     input_values = torch.tensor(input_features["input_values"]).unsqueeze(0)  # Add batch dimension
     predicted_ids = model.generate(input_values)
     transcription = processor.batch_decode(predicted_ids, skip_special_tokens=True)
     return transcription[0]

 def transcribe_audio(audio_data):
     input_features = preprocess_audio(audio_data)
     input_values = torch.tensor(input_features["input_values"]).unsqueeze(0)  # Add batch dimension
+    # Reshape the tensor to match the expected shape [batch_size, num_channels, sequence_length]
+    input_values = input_values.permute(0, 2, 1)
     predicted_ids = model.generate(input_values)
     transcription = processor.batch_decode(predicted_ids, skip_special_tokens=True)
     return transcription[0]