Spaces:
Running
Running
Update app.py
Browse files
app.py
CHANGED
@@ -1,6 +1,7 @@
|
|
1 |
import gradio as gr
|
2 |
from transformers import WhisperProcessor, WhisperForConditionalGeneration
|
3 |
import torch
|
|
|
4 |
|
5 |
# モデルとプロセッサの読み込み
|
6 |
model_name = "openai/whisper-large-v3"
|
@@ -9,8 +10,11 @@ model = WhisperForConditionalGeneration.from_pretrained(model_name)
|
|
9 |
|
10 |
# 音声ファイルを文字起こしする関数
|
11 |
def transcribe_audio(audio):
|
12 |
-
#
|
13 |
-
|
|
|
|
|
|
|
14 |
|
15 |
# モデルによる文字起こし
|
16 |
with torch.no_grad():
|
|
|
1 |
import gradio as gr
|
2 |
from transformers import WhisperProcessor, WhisperForConditionalGeneration
|
3 |
import torch
|
4 |
+
import librosa
|
5 |
|
6 |
# モデルとプロセッサの読み込み
|
7 |
model_name = "openai/whisper-large-v3"
|
|
|
10 |
|
11 |
# 音声ファイルを文字起こしする関数
|
12 |
def transcribe_audio(audio):
|
13 |
+
# librosaで音声を読み込む
|
14 |
+
audio_data, sampling_rate = librosa.load(audio, sr=16000)
|
15 |
+
|
16 |
+
# WhisperProcessorに渡すために、音声データを正しい形式に変換
|
17 |
+
audio_input = processor(audio_data, return_tensors="pt", sampling_rate=16000)
|
18 |
|
19 |
# モデルによる文字起こし
|
20 |
with torch.no_grad():
|