soiz commited on
Commit
23e60a0
·
verified ·
1 Parent(s): c5e0c8c

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +6 -2
app.py CHANGED
@@ -1,6 +1,7 @@
1
  import gradio as gr
2
  from transformers import WhisperProcessor, WhisperForConditionalGeneration
3
  import torch
 
4
 
5
  # モデルとプロセッサの読み込み
6
  model_name = "openai/whisper-large-v3"
@@ -9,8 +10,11 @@ model = WhisperForConditionalGeneration.from_pretrained(model_name)
9
 
10
  # 音声ファイルを文字起こしする関数
11
  def transcribe_audio(audio):
12
- # 音声を処理
13
- audio_input = processor(audio, return_tensors="pt", sampling_rate=16000)
 
 
 
14
 
15
  # モデルによる文字起こし
16
  with torch.no_grad():
 
1
  import gradio as gr
2
  from transformers import WhisperProcessor, WhisperForConditionalGeneration
3
  import torch
4
+ import librosa
5
 
6
  # モデルとプロセッサの読み込み
7
  model_name = "openai/whisper-large-v3"
 
10
 
11
  # 音声ファイルを文字起こしする関数
12
  def transcribe_audio(audio):
13
+ # librosaで音声を読み込む
14
+ audio_data, sampling_rate = librosa.load(audio, sr=16000)
15
+
16
+ # WhisperProcessorに渡すために、音声データを正しい形式に変換
17
+ audio_input = processor(audio_data, return_tensors="pt", sampling_rate=16000)
18
 
19
  # モデルによる文字起こし
20
  with torch.no_grad():