Spaces:

mskov
/

test

Runtime error

mskov commited on Jun 29, 2023

Commit

5684ca8

1 Parent(s): beee031

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -24,22 +24,6 @@ disable_caching()
 huggingface_token = os.environ["huggingface_token"]
-processor = AutoProcessor.from_pretrained("mskov/whisper_miso", use_auth_token=huggingface_token)
-def prepare_dataset(batch):
-    audio = batch["audio"]
-    batch["input_values"] = processor(audio["array"], sampling_rate=audio["sampling_rate"]).input_values[0]
-    batch["input_length"] = len(batch["input_values"])
-    with processor.as_target_processor():
-        batch["labels"] = processor(batch["sentence"]).input_ids
-    return batch
-dataset = load_dataset("mskov/miso_test", split="test")
-dataset = dataset.cast_column("audio", Audio(sampling_rate=16000))
-testRun = dataset.map(prepare_dataset, remove_columns=dataset.column_names)
-print(testRun)
-'''
 model = WhisperModel.from_pretrained("mskov/whisper_miso", use_auth_token=huggingface_token)
 feature_extractor = AutoFeatureExtractor.from_pretrained("mskov/whisper_miso", use_auth_token=huggingface_token)
@@ -55,4 +39,3 @@ decoder_input_ids = torch.tensor([[1, 1]]) * model.config.decoder_start_token_id
 last_hidden_state = model(input_features, decoder_input_ids=decoder_input_ids).last_hidden_state
 list(last_hidden_state.shape)
 print(list(last_hidden_state.shape))
-'''

 huggingface_token = os.environ["huggingface_token"]
 model = WhisperModel.from_pretrained("mskov/whisper_miso", use_auth_token=huggingface_token)
 feature_extractor = AutoFeatureExtractor.from_pretrained("mskov/whisper_miso", use_auth_token=huggingface_token)
 last_hidden_state = model(input_features, decoder_input_ids=decoder_input_ids).last_hidden_state
 list(last_hidden_state.shape)
 print(list(last_hidden_state.shape))