Spaces:

kadirnar
/

Open-Sora

Running

Open-Sora / configs /pixart /train /64x512x512.py

Upload 98 files

e7d5680 verified over 1 year ago

910 Bytes

	num_frames = 64
	frame_interval = 2
	image_size = (512, 512)

	# Define dataset
	root = None
	data_path = "CSV_PATH"
	use_image_transform = False
	num_workers = 4

	# Define acceleration
	dtype = "bf16"
	grad_checkpoint = True
	plugin = "zero2"
	sp_size = 1

	# Define model
	model = dict(
	type="PixArt-XL/2",
	space_scale=1.0,
	time_scale=2 / 3,
	from_pretrained=None,
	enable_flashattn=True,
	enable_layernorm_kernel=True,
	)
	vae = dict(
	type="VideoAutoencoderKL",
	from_pretrained="stabilityai/sd-vae-ft-ema",
	micro_batch_size=128,
	)
	text_encoder = dict(
	type="t5",
	from_pretrained="./pretrained_models/t5_ckpts",
	model_max_length=120,
	shardformer=True,
	)
	scheduler = dict(
	type="iddpm",
	timestep_respacing="",
	)

	# Others
	seed = 42
	outputs = "outputs"
	wandb = False

	epochs = 1000
	log_every = 10
	ckpt_every = 250
	load = None

	batch_size = 4
	lr = 2e-5
	grad_clip = 1.0