Spaces:

krypton
/

Test

Paused

App Files Files Community

Test / app.py

krypton's picture

Create app.py

92af8f1 verified 5 months ago

655 Bytes

	from transformers import TrOCRProcessor, VisionEncoderDecoderModel
	import requests
	from PIL import Image

	processor = TrOCRProcessor.from_pretrained("microsoft/trocr-base-handwritten")
	model = VisionEncoderDecoderModel.from_pretrained("microsoft/trocr-base-handwritten")

	# load image from the IAM dataset
	url = "https://fki.tic.heia-fr.ch/static/img/a01-122-02.jpg"
	image = Image.open(requests.get(url, stream=True).raw).convert("RGB")

	pixel_values = processor(image, return_tensors="pt").pixel_values
	generated_ids = model.generate(pixel_values)

	generated_text = processor.batch_decode(generated_ids, skip_special_tokens=True)[0]
	print(generated_text)