Spaces:

Luigi
/

Streaming-Zipformer

Running

Luigi commited on Jun 6

Commit

8ebc812

1 Parent(s): 719d009

add simplified to traditional chinese conversion

Files changed (2) hide show

app/asr_worker.py CHANGED Viewed

@@ -1,13 +1,13 @@
 import numpy as np
 import sherpa_onnx
 from pathlib import Path
-import scipy.signal
-def resample_audio(audio, orig_sr, target_sr):
-    return scipy.signal.resample_poly(audio, target_sr, orig_sr)
 MODEL_DIR = Path("models/zipformer_bilingual")
 def create_recognizer():
     return sherpa_onnx.OnlineRecognizer.from_transducer(
         tokens=str(MODEL_DIR / "tokens.txt"),
@@ -21,6 +21,9 @@ def create_recognizer():
         decoding_method="greedy_search"
     )
 def stream_audio(raw_pcm_bytes, stream, recognizer):
     audio = np.frombuffer(raw_pcm_bytes, dtype=np.float32)
     if audio.size == 0:
@@ -33,7 +36,7 @@ def stream_audio(raw_pcm_bytes, stream, recognizer):
     if recognizer.is_ready(stream):
         recognizer.decode_streams([stream])
     result = recognizer.get_result(stream)
-    return result, rms
 def finalize_stream(stream, recognizer):
     tail = np.zeros(int(0.66 * 16000), dtype=np.float32)
@@ -41,4 +44,5 @@ def finalize_stream(stream, recognizer):
     stream.input_finished()
     while recognizer.is_ready(stream):
         recognizer.decode_streams([stream])
-    return recognizer.get_result(stream)

 import numpy as np
+import pysoxr
+from opencc import OpenCC
 import sherpa_onnx
 from pathlib import Path
 MODEL_DIR = Path("models/zipformer_bilingual")
+converter = OpenCC('s2t')  # Simplified to Traditional Chinese
 def create_recognizer():
     return sherpa_onnx.OnlineRecognizer.from_transducer(
         tokens=str(MODEL_DIR / "tokens.txt"),
         decoding_method="greedy_search"
     )
+def resample_audio(audio, orig_sr, target_sr):
+    return pysoxr.resample(audio, orig_sr, target_sr)
 def stream_audio(raw_pcm_bytes, stream, recognizer):
     audio = np.frombuffer(raw_pcm_bytes, dtype=np.float32)
     if audio.size == 0:
     if recognizer.is_ready(stream):
         recognizer.decode_streams([stream])
     result = recognizer.get_result(stream)
+    return converter.convert(result), rms
 def finalize_stream(stream, recognizer):
     tail = np.zeros(int(0.66 * 16000), dtype=np.float32)
     stream.input_finished()
     while recognizer.is_ready(stream):
         recognizer.decode_streams([stream])
+    result = recognizer.get_result(stream)
+    return converter.convert(result)

requirements.txt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8c564834ceb94d0d9aceef1ba37eed4451bca6eb05158ebd81518a7e68a1c2ef
-size 60

 version https://git-lfs.github.com/spec/v1
+oid sha256:4b08ab37381178cb19b7876c22c7df8a82205f03c506c487a6f0cbe773707c23
+size 88