badassgi

Running

App Files Files Community

badassgi / app.py

openfree

Update app.py

0fdae18 verified 10 months ago

raw

history blame

2.92 kB

	import spaces
	import torch

	import gradio as gr
	from transformers import pipeline
	from huggingface_hub import InferenceClient
	import tempfile
	import os

	MODEL_NAME = "openai/whisper-large-v3-turbo"
	BATCH_SIZE = 8
	FILE_LIMIT_MB = 1000

	device = 0 if torch.cuda.is_available() else "cpu"

	pipe = pipeline(
	task="automatic-speech-recognition",
	model=MODEL_NAME,
	chunk_length_s=30,
	device=device,
	)

	# Hugging Face InferenceClient 사용
	hf_client = InferenceClient("CohereForAI/c4ai-command-r-plus-08-2024", token=os.getenv("HF_TOKEN"))

	@spaces.GPU
	def transcribe_summarize_and_blog(inputs, task):
	if inputs is None:
	raise gr.Error("오디오 파일이 제출되지 않았습니다! 요청을 제출하기 전에 오디오 파일을 업로드하거나 녹음해 주세요.")

	# 음성을 텍스트로 변환
	text = pipe(inputs, batch_size=BATCH_SIZE, generate_kwargs={"task": task}, return_timestamps=True)["text"]

	# 변환된 텍스트 요약 요청
	try:
	summary = hf_client.summarization(text)
	except Exception as e:
	raise gr.Error(f"요약 중 오류가 발생했습니다: {e}")

	# 블로그 포스팅 생성 요청
	try:
	blog_post = hf_client.text_generation(
	prompt=f"다음 내용을 기반으로 블로그 포스팅을 작성해 주세요:\n{text}",
	max_length=500,
	temperature=0.7
	)
	except Exception as e:
	raise gr.Error(f"블로그 글 생성 중 오류가 발생했습니다: {e}")

	return {
	"transcribed_text": text,
	"summary": summary["summary_text"],
	"blog_post": blog_post["generated_text"]
	}

	css = """
	footer {
	visibility: hidden;
	}
	"""

	file_transcribe = gr.Interface(
	fn=transcribe_summarize_and_blog,
	inputs=[
	gr.Audio(sources="upload", type="filepath", label="오디오 파일"),
	gr.Radio(["transcribe", "translate"], label="작업", value="transcribe"),
	],
	outputs=["text", "text", "text"], # 변환된 텍스트, 요약, 블로그 글 출력
	title="받아쓰기 AI: 음성을 텍스트 변환, 요약 및 블로그 포스팅 자동 생성",
	flagging_mode="never",
	)

	mf_transcribe = gr.Interface(css=css,
	fn=transcribe_summarize_and_blog,
	inputs=[
	gr.Audio(sources="microphone", type="filepath"),
	gr.Radio(["transcribe", "translate"], label="작업", value="transcribe"),
	],
	outputs=["text", "text", "text"], # 변환된 텍스트, 요약, 블로그 글 출력
	title="받아쓰기 AI: 음성을 텍스트 변환, 요약 및 블로그 포스팅 자동 생성",
	flagging_mode="never",
	)



	# demo 변수를 Gradio Blocks 컨테이너로 정의
	demo = gr.Blocks(theme="Nymbo/Nymbo_Theme")

	with demo:
	gr.TabbedInterface([mf_transcribe, file_transcribe], ["마이크", "오디오 파일"])

	demo.queue().launch(ssr_mode=False)