Spaces:

MusIre
/

practiceAI

Sleeping

MusIre commited on Nov 27, 2023

Commit

0cb2f0c

1 Parent(s): 638cf1e

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -7,6 +7,7 @@ subprocess.run(["pip", "install", "transformers"])
 subprocess.run(["pip", "install", "torch", "torchvision", "torchaudio", "-f", "https://download.pytorch.org/whl/torch_stable.html"])
 import gradio as gr
 import numpy as np
 from transformers import WhisperProcessor, WhisperForConditionalGeneration
 # Load model and processor
@@ -23,7 +24,8 @@ def preprocess_audio(audio_data, sampling_rate=16_000):
 # Function to perform ASR on audio data
 def transcribe_audio(audio_data):
     input_features = preprocess_audio(audio_data)
-    predicted_ids = model.generate(input_features["input_values"])
     transcription = processor.batch_decode(predicted_ids, skip_special_tokens=True)
     return transcription[0]

 subprocess.run(["pip", "install", "torch", "torchvision", "torchaudio", "-f", "https://download.pytorch.org/whl/torch_stable.html"])
 import gradio as gr
 import numpy as np
+import torch
 from transformers import WhisperProcessor, WhisperForConditionalGeneration
 # Load model and processor
 # Function to perform ASR on audio data
 def transcribe_audio(audio_data):
     input_features = preprocess_audio(audio_data)
+    input_values = torch.tensor(input_features["input_values"]).unsqueeze(0)  # Add batch dimension
+    predicted_ids = model.generate(input_values)
     transcription = processor.batch_decode(predicted_ids, skip_special_tokens=True)
     return transcription[0]