Spaces:

mskov
/

test

Runtime error

mskov commited on Jun 30, 2023

Commit

7d55390

1 Parent(s): 8374951

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -20,10 +20,10 @@ miso_tokenizer = WhisperTokenizer.from_pretrained("mskov/whisper_miso", use_auth
 dataset = load_dataset("mskov/miso_test", split="test").cast_column("audio", Audio(sampling_rate=16000))
-print(dataset, "and at 0 ", dataset[0])
 inputs = feature_extractor(dataset[0]["audio"]["array"], return_tensors="pt")
-tokenized_dataset = miso_tokenizer(inputs)  # Tokenize the dataset
 input_ids = features.input_ids
 attention_mask = features.attention_mask

 dataset = load_dataset("mskov/miso_test", split="test").cast_column("audio", Audio(sampling_rate=16000))
+print(dataset, "and at 0[audio][array] ", dataset[0]["audio"]["array"], type(dataset[0]["audio"]["array"]), "and at audio : " dataset[0]["audio"])
 inputs = feature_extractor(dataset[0]["audio"]["array"], return_tensors="pt")
+tokenized_dataset = miso_tokenizer(dataset["audio"]["array"])  # Tokenize the dataset
 input_ids = features.input_ids
 attention_mask = features.attention_mask