Spaces:

vankienemk
/

Voice-regconizer

Sleeping

vankienemk commited on Apr 10

Commit

d66b2fe

verified ·

1 Parent(s): 32b4f42

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,21 +1,23 @@
 import gradio as gr
 from transformers import pipeline
-# Pipeline nhận diện tiếng Việt
-asr = pipeline("automatic-speech-recognition", model="mad1999/realtime-stt-vietnamese")
 def transcribe(audio_file):
     if audio_file is None:
         return "Chưa có file âm thanh."
     result = asr(audio_file)
     return result["text"]
 demo = gr.Interface(
     fn=transcribe,
     inputs=gr.Audio(type="filepath", label="Tải lên file âm thanh (.wav, .mp3...)"),
     outputs=gr.Textbox(label="Kết quả chuyển văn bản"),
-    title="Nhận diện tiếng Việt thời gian thực",
-    description="Sử dụng mô hình mad1999/realtime-stt-vietnamese để chuyển giọng nói thành văn bản tiếng Việt."
 )
 demo.launch()

 import gradio as gr
 from transformers import pipeline
+# Tạo pipeline nhận diện giọng nói
+asr = pipeline("automatic-speech-recognition", model="openai/whisper-base")
+# Hàm xử lý âm thanh
 def transcribe(audio_file):
     if audio_file is None:
         return "Chưa có file âm thanh."
     result = asr(audio_file)
     return result["text"]
+# Giao diện Gradio
 demo = gr.Interface(
     fn=transcribe,
     inputs=gr.Audio(type="filepath", label="Tải lên file âm thanh (.wav, .mp3...)"),
     outputs=gr.Textbox(label="Kết quả chuyển văn bản"),
+    title="Nhận diện giọng nói bằng Whisper",
+    description="Tải file âm thanh và hệ thống sẽ nhận diện nội dung giọng nói bằng mô hình Whisper của OpenAI."
 )
 demo.launch()