PDF-converter2 / app.py
soiz1's picture
Update app.py
03f50bc verified
import gradio as gr
from pdf2image import convert_from_path
from PIL import Image
import img2pdf
import tempfile
import os
def downscale_pdf(pdf_file, max_width=3000, input_dpi=150):
with tempfile.TemporaryDirectory() as tmpdir:
# 1. dpiを下げて読み込み(元が300なら150に半減)
images = convert_from_path(pdf_file.name, dpi=input_dpi, fmt='jpeg', output_folder=tmpdir)
downscaled_images = []
for i, img in enumerate(images):
w, h = img.size
print(f"Original Page {i+1}: {w}x{h} = {w * h} px")
# サイズ制限
if w > max_width:
ratio = max_width / w
new_w = int(w * ratio)
new_h = int(h * ratio)
img = img.resize((new_w, new_h), Image.LANCZOS)
print(f"Downscaled Page {i+1}: {new_w}x{new_h} = {new_w * new_h} px")
else:
new_w, new_h = w, h
print(f"Page {i+1}: サイズ変更なし")
tmp_image_path = os.path.join(tmpdir, f"page_{i+1}.jpg")
img.save(tmp_image_path, "JPEG", quality=90)
downscaled_images.append((tmp_image_path, (new_w, new_h)))
# 2. img2pdfのdpiを画像サイズから計算する
# dpi = (元画像のdpi) * (縮小率)
# 今回は画像のピクセル数が縮小されているので、それに対応するdpiを設定する
# ここでは単純に input_dpi をそのまま使うことも可
pdf_bytes = b""
layout_fun = img2pdf.get_layout_fun(pagesize=None) # デフォルトページサイズ
with open(os.path.join(tmpdir, "downscaled.pdf"), "wb") as f:
f.write(
img2pdf.convert(
[path for path, size in downscaled_images],
dpi=input_dpi,
)
)
final_pdf_file = tempfile.NamedTemporaryFile(delete=False, suffix=".pdf")
with open(os.path.join(tmpdir, "downscaled.pdf"), "rb") as src, open(final_pdf_file.name, "wb") as dst:
dst.write(src.read())
return final_pdf_file.name
with gr.Blocks() as demo:
gr.Markdown("## PDFダウンサイザー for Audiveris")
gr.Markdown(
"PDFをアップロードすると、ページ画像を縮小してAudiveris向けに最適化したPDFを生成します。"
)
with gr.Row():
pdf_input = gr.File(label="PDFファイルをアップロード")
pdf_output = gr.File(label="変換後PDF")
convert_button = gr.Button("変換してダウンロード")
convert_button.click(fn=downscale_pdf, inputs=pdf_input, outputs=pdf_output)
demo.launch()