Spaces:

pythonitalia
/

realtime-transcription

Paused

return_timestamps

c9f35a7 over 1 year ago

916 Bytes

	import pickle
	from typing import Union
	from fastapi import Request
	import torch
	from transformers import pipeline

	from fastapi import FastAPI

	app = FastAPI()


	@app.get("/")
	def read_root():
	return {"status": "ok"}


	TRANSCRIBE_PIPELINE = pipeline(
	"automatic-speech-recognition",
	model="openai/whisper-large-v3",
	torch_dtype=torch.float16,
	device="mps",
	model_kwargs={"attn_implementation": "sdpa"},
	)


	@app.post("/transcribe")
	async def transcribe(request: Request):
	body = await request.body()
	audio_chunk = pickle.loads(body)
	outputs = TRANSCRIBE_PIPELINE(
	audio_chunk,
	chunk_length_s=30,
	batch_size=24,
	generate_kwargs={
	'task': 'transcribe',
	'language': 'english'
	},
	# return_timestamps='word'
	return_timestamps=False
	)
	text = outputs["text"].strip()
	return {"transcribe": text}