Spaces:

Bagda
/

Swar

Running

Bagda commited on Jun 12

Commit

bf5a004

verified ·

1 Parent(s): 891d755

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -25,3 +25,32 @@ demo = gr.Interface(
 )
 demo.launch()

 )
 demo.launch()
+from transformers import WhisperProcessor, WhisperForConditionalGeneration
+import torch
+from datasets import load_dataset
+# Load model and processor
+processor = WhisperProcessor.from_pretrained("openai/whisper-small")
+model = WhisperForConditionalGeneration.from_pretrained("openai/whisper-small")
+# Optional: Use GPU if available
+device = "cuda" if torch.cuda.is_available() else "cpu"
+model = model.to(device)
+# Load sample audio (here using a dummy dataset, aap apni audio file bhi use kar sakte hain)
+ds = load_dataset("hf-internal-testing/librispeech_asr_dummy", "clean", split="validation")
+sample = ds[0]["audio"]
+# Prepare audio input
+input_features = processor(sample["array"], sampling_rate=sample["sampling_rate"], return_tensors="pt").input_features
+input_features = input_features.to(device)
+# Generate transcription
+predicted_ids = model.generate(input_features)
+# Decode transcription
+transcription = processor.batch_decode(predicted_ids, skip_special_tokens=True)
+print(transcription)