Spaces:

soiz
/

audio-text

Running

soiz commited on Nov 22, 2024

Commit

026aeab

verified ·

1 Parent(s): c4007b5

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -14,11 +14,15 @@ def transcribe_audio(audio):
     audio_data, sampling_rate = librosa.load(audio, sr=16000)
     # WhisperProcessorに渡すために、音声データを正しい形式に変換
     audio_input = processor(audio_data, return_tensors="pt", sampling_rate=16000)
     # モデルによる文字起こし
     with torch.no_grad():
-        predicted_ids = model.generate(input_values=audio_input.input_values)  # 修正: input_ids → input_values
     # 文字起こし結果のデコード
     transcription = processor.decode(predicted_ids[0], skip_special_tokens=True)
@@ -34,4 +38,4 @@ interface = gr.Interface(
 )
 # インターフェースの起動
-interface.launch()

     audio_data, sampling_rate = librosa.load(audio, sr=16000)
     # WhisperProcessorに渡すために、音声データを正しい形式に変換
+    # 返された辞書からinput_valuesを直接取得する
     audio_input = processor(audio_data, return_tensors="pt", sampling_rate=16000)
+    # WhisperProcessorの出力にはinput_valuesが含まれるので、正しい属性にアクセス
+    input_values = audio_input['input_values']
     # モデルによる文字起こし
     with torch.no_grad():
+        predicted_ids = model.generate(input_values=input_values)
     # 文字起こし結果のデコード
     transcription = processor.decode(predicted_ids[0], skip_special_tokens=True)
 )
 # インターフェースの起動
+interface.launch(share=True)  # `share=True`で公開リンクを生成