Spaces:

Tbb1111
/

pdfTranslate

Runtime error

App Files Files Community

Tbb1111 commited on May 2

Commit

7c5b58c

verified ·

1 Parent(s): 7b6f181

Update app.py

Browse files

Files changed (1) hide show

app.py +10 -41

app.py CHANGED Viewed

@@ -1,8 +1,5 @@
 import gradio as gr
 from transformers import T5ForConditionalGeneration, T5Tokenizer
-import torch
-import fitz  # PyMuPDF
-from fpdf import FPDF
 # 加载 T5 模型和分词器
 model_name = "t5-small"  # 可以根据需要调整模型大小
@@ -10,52 +7,24 @@ model = T5ForConditionalGeneration.from_pretrained(model_name)
 tokenizer = T5Tokenizer.from_pretrained(model_name)
 # 翻译功能
-def translate_pdf(pdf_file):
-    # 读取 PDF 文件
-    doc = fitz.open(pdf_file.name)
-    text = ""
-    for page in doc:
-        text += page.get_text()
-    # 为了避免输入超长，按段落拆分翻译
-    paragraphs = text.split("\n")
-    translated_paragraphs = []
-    # 分批翻译每一段
-    for paragraph in paragraphs:
-        if len(paragraph.strip()) == 0:
-            continue
-        # 使用 T5 模型进行翻译
-        inputs = tokenizer.encode("translate English to Chinese: " + paragraph, return_tensors="pt", max_length=512, truncation=True)
-        outputs = model.generate(inputs, max_length=1024, num_beams=4, early_stopping=True)
-        translated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
-        translated_paragraphs.append(translated_text)
-    # 将所有翻译后的段落合并
-    translated_text = "\n".join(translated_paragraphs)
-    # 创建翻译后的 PDF
-    translated_pdf = FPDF()
-    translated_pdf.add_page()
-    translated_pdf.set_font("Arial", size=12)
-    translated_pdf.multi_cell(0, 10, translated_text)
-    # 保存翻译后的 PDF
-    translated_pdf_path = "translated_output.pdf"
-    translated_pdf.output(translated_pdf_path)
-    return translated_pdf_path
 # 创建 Gradio 界面
 with gr.Blocks() as demo:
-    gr.Markdown("# PDF 英文翻译器")
     with gr.Row():
-        pdf_input = gr.File(label="上传英文 PDF 文件", file_types=[".pdf"])
     translate_button = gr.Button("开始翻译")
-    output_pdf = gr.File(label="下载翻译后的 PDF")
-    translate_button.click(fn=translate_pdf, inputs=pdf_input, outputs=output_pdf)
 demo.launch()

 import gradio as gr
 from transformers import T5ForConditionalGeneration, T5Tokenizer
 # 加载 T5 模型和分词器
 model_name = "t5-small"  # 可以根据需要调整模型大小
 tokenizer = T5Tokenizer.from_pretrained(model_name)
 # 翻译功能
+def translate_text(input_text):
+    # 使用 T5 模型进行翻译
+    inputs = tokenizer.encode("translate English to Chinese: " + input_text, return_tensors="pt", max_length=512, truncation=True)
+    outputs = model.generate(inputs, max_length=1024, num_beams=4, early_stopping=True)
+    translated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
+    return translated_text
 # 创建 Gradio 界面
 with gr.Blocks() as demo:
+    gr.Markdown("# 英文文本翻译器")
     with gr.Row():
+        text_input = gr.Textbox(label="输入英文文本", lines=5)  # 让用户输入英文文本
     translate_button = gr.Button("开始翻译")
+    output_text = gr.Textbox(label="翻译后的中文文本", lines=5)  # 显示翻译后的中文文本
+    translate_button.click(fn=translate_text, inputs=text_input, outputs=output_text)
 demo.launch()