k-l-lambda commited on May 13, 2024

Commit

5121da0

1 Parent(s): 438adad

train folder of 20240508 commit.

Browse files

Files changed (28) hide show

20240418-stage1-dance800/config.yaml +103 -0
20240422-stage1-ubc+td1/config.yaml +106 -0
20240423-stage1-ubc+td10/config.yaml +106 -0
20240425-stage2-openpg/config.yaml +92 -0
20240428-stage2-6k/config.yaml +97 -0
20240504-stage1-51k-raw-opg/config.yaml +105 -0
20240508-stage1-openpg-nopaf/checkpoint-68000/optimizer.bin +3 -0
20240508-stage1-openpg-nopaf/checkpoint-68000/pytorch_model.bin +3 -0
20240508-stage1-openpg-nopaf/checkpoint-68000/random_states_0.pkl +3 -0
20240508-stage1-openpg-nopaf/checkpoint-68000/scaler.pt +3 -0
20240508-stage1-openpg-nopaf/checkpoint-68000/scheduler.bin +3 -0
20240508-stage1-openpg-nopaf/checkpoint-69000/optimizer.bin +3 -0
20240508-stage1-openpg-nopaf/checkpoint-69000/pytorch_model.bin +3 -0
20240508-stage1-openpg-nopaf/checkpoint-69000/random_states_0.pkl +3 -0
20240508-stage1-openpg-nopaf/checkpoint-69000/scaler.pt +3 -0
20240508-stage1-openpg-nopaf/checkpoint-69000/scheduler.bin +3 -0
20240508-stage1-openpg-nopaf/config.yaml +108 -0
20240508-stage1-openpg-nopaf/denoising_unet-65381.pth +3 -0
20240508-stage1-openpg-nopaf/denoising_unet-66980.pth +3 -0
20240508-stage1-openpg-nopaf/denoising_unet-68579.pth +3 -0
20240508-stage1-openpg-nopaf/pose_guider-65381.pth +3 -0
20240508-stage1-openpg-nopaf/pose_guider-66980.pth +3 -0
20240508-stage1-openpg-nopaf/pose_guider-68579.pth +3 -0
20240508-stage1-openpg-nopaf/reference_unet-65381.pth +3 -0
20240508-stage1-openpg-nopaf/reference_unet-66980.pth +3 -0
20240508-stage1-openpg-nopaf/reference_unet-68579.pth +3 -0
20240510-stage1-9k/config.yaml +105 -0
20240513-stage2-9k/config.yaml +99 -0

20240418-stage1-dance800/config.yaml ADDED Viewed

	@@ -0,0 +1,103 @@

+base_model_path: ./pretrained_weights/sd-image-variations-diffusers
+checkpointing_steps: 1000
+controlnet_openpose_path: ./pretrained_weights/control_v11p_sd15_openpose/diffusion_pytorch_model.bin
+data:
+  crop_scale:
+  - 0.6
+  - 1
+  do_center_crop: false
+  meta_paths:
+  - /workspace/develop/video/data/tiktok-dance/good-meta.json
+  ref_augment:
+    downsample:
+      min_scale_logit: -1.2
+      p: 0.3
+    pan:
+    - 0.04
+    - 0.02
+    rotate: 8
+    scale:
+    - 0.9
+    - 1.4
+  sample_margin: 30
+  train_bs: 4
+  train_height: 1152
+  train_width: 768
+enable_zero_snr: true
+exp_name: stage1-dance800
+freeze_denoise: false
+freeze_reference: false
+image_encoder_path: ./pretrained_weights/sd-image-variations-diffusers/image_encoder
+noise_offset: 0.05
+noise_scheduler_kwargs:
+  beta_end: 0.012
+  beta_schedule: scaled_linear
+  beta_start: 0.00085
+  clip_sample: false
+  num_train_timesteps: 1000
+  steps_offset: 1
+openpose_guider:
+  enable: false
+output_dir: /workspace/camus/train
+pose_guider_pretrain: true
+resume_from_checkpoint: latest
+save_dir: /workspace/camus/train/20240418-stage1-dance800/
+save_model_epoch_interval: 1
+seed: 12580
+snr_gamma: 5.0
+solver:
+  adam_beta1: 0.9
+  adam_beta2: 0.999
+  adam_epsilon: 1.0e-08
+  adam_weight_decay: 0.01
+  enable_xformers_memory_efficient_attention: true
+  gradient_accumulation_steps: 1
+  gradient_checkpointing: false
+  learning_rate: 1.0e-05
+  lr_scheduler: constant
+  lr_warmup_steps: 1
+  max_grad_norm: 1.0
+  max_train_steps: 30000
+  mixed_precision: fp16
+  scale_lr: false
+  use_8bit_adam: false
+uncond_ratio: 0.1
+vae_model_path: ./pretrained_weights/sd-vae-ft-mse
+val:
+  special_steps:
+  - 24001
+  validation_steps: 1000
+validation:
+  metric:
+    batch_size: 4
+    generated_frames:
+    - 16
+    - 45
+    - 98
+    - 150
+    - 188
+    - 220
+    - 268
+    - 284
+    guidance_scale: 2.4
+    ref_frame: 16
+    seed: 42
+    size:
+    - 768
+    - 1152
+    steps: 20
+    videos:
+    - configs/inference/metric/o4flk5RPE4D4fgNEUNFRZIbOBjCsEgB9DQQQLA.mp4
+    - configs/inference/metric/ocMJyAEDjQzjwqAuIPABAvmRyofjKiYhBExati.mp4
+    - configs/inference/metric/ocQoBObnUgBnVskCnPe41sYRiBcAFD5f8AN1Rg.mp4
+    - configs/inference/metric/oE2tJFpDWANbMe7cxAg3hoq0QAPNeRnCQefG8F.mp4
+    - configs/inference/metric/oEOgTIKvy7lAQIfZ37E5BFmCVBID3gIQUQfMdv.mp4
+    - configs/inference/metric/oEtwozJ6AoIBJ6oyK6rAAQGAOiEWIQixF2F2fB.mp4
+    - configs/inference/metric/oUGmQqeqoAAega5fGgnAICfOWJRAAFTJCgDibU.mp4
+    - configs/inference/metric/oYQJ5zLiEgG71SAAFEfAeVIEVFROW4ZGQJTfeF.mp4
+  pose_image_paths:
+  - configs/inference/pose_images/A1eEZvfJRUS/frame70.png
+  ref_image_paths:
+  - configs/inference/ref_images/anyone-3.png
+  - configs/inference/ref_images/anyone-11.png
+weight_dtype: fp16

20240422-stage1-ubc+td1/config.yaml ADDED Viewed

	@@ -0,0 +1,106 @@

+base_model_path: ./pretrained_weights/sd-image-variations-diffusers
+checkpointing_steps: 1000
+controlnet_openpose_path: ./pretrained_weights/control_v11p_sd15_openpose/diffusion_pytorch_model.bin
+data:
+  crop_scale:
+  - 0.8
+  - 1.2
+  do_center_crop: false
+  meta_paths:
+  - /workspace/develop/video/data/ubc_tiktok-dropout0.03/ubc-meta.json
+  - /workspace/develop/video/data/tiktok-dance/meta-1per_person.json
+  ref_augment:
+    downsample:
+      min_scale_logit: -1.2
+      p: 0.3
+    pan:
+    - 0.04
+    - 0.02
+    rotate: 8
+    scale:
+    - 0.9
+    - 1.2
+  sample_margin: 30
+  train_bs: 4
+  train_height: 1152
+  train_width: 768
+enable_zero_snr: true
+exp_name: stage1-ubc+td1
+freeze_denoise: false
+freeze_reference: false
+image_encoder_path: ./pretrained_weights/sd-image-variations-diffusers/image_encoder
+noise_offset: 0.05
+noise_scheduler_kwargs:
+  beta_end: 0.012
+  beta_schedule: scaled_linear
+  beta_start: 0.00085
+  clip_sample: false
+  num_train_timesteps: 1000
+  steps_offset: 1
+openpose_guider:
+  enable: false
+output_dir: /workspace/camus/train
+pose_guider_pretrain: true
+resume_from_checkpoint: latest
+save_dir: /workspace/camus/train/20240422-stage1-ubc+td1
+save_model_epoch_interval: 1
+seed: 12580
+snr_gamma: 5.0
+solver:
+  adam_beta1: 0.9
+  adam_beta2: 0.999
+  adam_epsilon: 1.0e-08
+  adam_weight_decay: 0.01
+  enable_xformers_memory_efficient_attention: true
+  gradient_accumulation_steps: 1
+  gradient_checkpointing: false
+  learning_rate: 1.0e-05
+  lr_scheduler: constant
+  lr_warmup_steps: 1
+  max_grad_norm: 1.0
+  max_train_steps: 30000
+  mixed_precision: fp16
+  scale_lr: false
+  use_8bit_adam: false
+uncond_ratio: 0.1
+vae_model_path: ./pretrained_weights/sd-vae-ft-mse
+val:
+  validation_steps: 2000
+validation:
+  metric:
+    batch_size: 4
+    generated_frames:
+    - 16
+    - 45
+    - 98
+    - 150
+    - 188
+    - 220
+    - 268
+    - 284
+    guidance_scale: 2.4
+    ref_frame: 16
+    seed: 42
+    size:
+    - 768
+    - 1152
+    steps: 20
+    videos:
+    - configs/inference/metric/o4flk5RPE4D4fgNEUNFRZIbOBjCsEgB9DQQQLA.mp4
+    - configs/inference/metric/ocMJyAEDjQzjwqAuIPABAvmRyofjKiYhBExati.mp4
+    - configs/inference/metric/ocQoBObnUgBnVskCnPe41sYRiBcAFD5f8AN1Rg.mp4
+    - configs/inference/metric/oE2tJFpDWANbMe7cxAg3hoq0QAPNeRnCQefG8F.mp4
+    - configs/inference/metric/oEOgTIKvy7lAQIfZ37E5BFmCVBID3gIQUQfMdv.mp4
+    - configs/inference/metric/oEtwozJ6AoIBJ6oyK6rAAQGAOiEWIQixF2F2fB.mp4
+    - configs/inference/metric/oUGmQqeqoAAega5fGgnAICfOWJRAAFTJCgDibU.mp4
+    - configs/inference/metric/oYQJ5zLiEgG71SAAFEfAeVIEVFROW4ZGQJTfeF.mp4
+  pose_image_paths:
+  - configs/inference/pose_images/A1eEZvfJRUS/frame70.png
+  - configs/inference/pose_images/A1eEZvfJRUS/frame150.png
+  - configs/inference/pose_images/A1eEZvfJRUS/frame190.png
+  ref_image_paths:
+  - configs/inference/ref_images/anyone-1.png
+  - configs/inference/ref_images/anyone-2.png
+  - configs/inference/ref_images/anyone-3.png
+  - configs/inference/ref_images/anyone-11.png
+weight_dtype: fp16

20240423-stage1-ubc+td10/config.yaml ADDED Viewed

	@@ -0,0 +1,106 @@

+base_model_path: ./pretrained_weights/sd-image-variations-diffusers
+checkpointing_steps: 1000
+controlnet_openpose_path: ./pretrained_weights/control_v11p_sd15_openpose/diffusion_pytorch_model.bin
+data:
+  crop_scale:
+  - 0.8
+  - 1.2
+  do_center_crop: false
+  meta_paths:
+  - /workspace/develop/video/data/ubc_tiktok-dropout0.03/ubc-meta.json
+  - /workspace/develop/video/data/tiktok-dance/meta-10per_person.json
+  ref_augment:
+    downsample:
+      min_scale_logit: -1.2
+      p: 0.3
+    pan:
+    - 0.04
+    - 0.02
+    rotate: 8
+    scale:
+    - 0.9
+    - 1.2
+  sample_margin: 30
+  train_bs: 4
+  train_height: 1152
+  train_width: 768
+enable_zero_snr: true
+exp_name: stage1-ubc+td10
+freeze_denoise: false
+freeze_reference: false
+image_encoder_path: ./pretrained_weights/sd-image-variations-diffusers/image_encoder
+noise_offset: 0.05
+noise_scheduler_kwargs:
+  beta_end: 0.012
+  beta_schedule: scaled_linear
+  beta_start: 0.00085
+  clip_sample: false
+  num_train_timesteps: 1000
+  steps_offset: 1
+openpose_guider:
+  enable: false
+output_dir: /workspace/camus/train
+pose_guider_pretrain: true
+resume_from_checkpoint: latest
+save_dir: /workspace/camus/train/20240423-stage1-ubc+td10
+save_model_epoch_interval: 1
+seed: 12580
+snr_gamma: 5.0
+solver:
+  adam_beta1: 0.9
+  adam_beta2: 0.999
+  adam_epsilon: 1.0e-08
+  adam_weight_decay: 0.01
+  enable_xformers_memory_efficient_attention: true
+  gradient_accumulation_steps: 1
+  gradient_checkpointing: false
+  learning_rate: 1.0e-05
+  lr_scheduler: constant
+  lr_warmup_steps: 1
+  max_grad_norm: 1.0
+  max_train_steps: 30000
+  mixed_precision: fp16
+  scale_lr: false
+  use_8bit_adam: false
+uncond_ratio: 0.1
+vae_model_path: ./pretrained_weights/sd-vae-ft-mse
+val:
+  validation_steps: 2000
+validation:
+  metric:
+    batch_size: 4
+    generated_frames:
+    - 16
+    - 45
+    - 98
+    - 150
+    - 188
+    - 220
+    - 268
+    - 284
+    guidance_scale: 2.4
+    ref_frame: 16
+    seed: 42
+    size:
+    - 768
+    - 1152
+    steps: 20
+    videos:
+    - configs/inference/metric/o4flk5RPE4D4fgNEUNFRZIbOBjCsEgB9DQQQLA.mp4
+    - configs/inference/metric/ocMJyAEDjQzjwqAuIPABAvmRyofjKiYhBExati.mp4
+    - configs/inference/metric/ocQoBObnUgBnVskCnPe41sYRiBcAFD5f8AN1Rg.mp4
+    - configs/inference/metric/oE2tJFpDWANbMe7cxAg3hoq0QAPNeRnCQefG8F.mp4
+    - configs/inference/metric/oEOgTIKvy7lAQIfZ37E5BFmCVBID3gIQUQfMdv.mp4
+    - configs/inference/metric/oEtwozJ6AoIBJ6oyK6rAAQGAOiEWIQixF2F2fB.mp4
+    - configs/inference/metric/oUGmQqeqoAAega5fGgnAICfOWJRAAFTJCgDibU.mp4
+    - configs/inference/metric/oYQJ5zLiEgG71SAAFEfAeVIEVFROW4ZGQJTfeF.mp4
+  pose_image_paths:
+  - configs/inference/pose_images/A1eEZvfJRUS/frame70.png
+  - configs/inference/pose_images/A1eEZvfJRUS/frame150.png
+  - configs/inference/pose_images/A1eEZvfJRUS/frame190.png
+  ref_image_paths:
+  - configs/inference/ref_images/anyone-1.png
+  - configs/inference/ref_images/anyone-2.png
+  - configs/inference/ref_images/anyone-3.png
+  - configs/inference/ref_images/anyone-11.png
+weight_dtype: fp16

20240425-stage2-openpg/config.yaml ADDED Viewed

	@@ -0,0 +1,92 @@

+base_model_path: ./pretrained_weights/stable-diffusion-v1-5
+checkpointing_steps: 2000
+data:
+  crop_scale:
+  - 1
+  - 1
+  do_center_crop: false
+  meta_paths:
+  - /workspace/develop/video/data/ubc_tiktok-dropout0.03/ubc-meta.json
+  - /workspace/develop/video/data/tiktok-dance/good-meta.json
+  - /workspace/develop/video/data/20240321/meta.json
+  - /workspace/develop/video/data/20240327/meta.json
+  n_sample_frames: 24
+  ref_augment:
+    pan:
+    - 0.04
+    - 0.04
+    rotate: 2
+    scale:
+    - 0.9
+    - 1.0
+  sample_rate: 4
+  train_bs: 1
+  train_height: 960
+  train_width: 640
+enable_zero_snr: true
+exp_name: stage2-openpg
+image_encoder_path: ./pretrained_weights/sd-image-variations-diffusers/image_encoder
+mm_path: ./pretrained_weights/mm_sd_v15_v2.ckpt
+noise_offset: 0.05
+noise_scheduler_kwargs:
+  beta_end: 0.012
+  beta_schedule: linear
+  beta_start: 0.00085
+  clip_sample: false
+  num_train_timesteps: 1000
+  steps_offset: 1
+openpose_guider:
+  block_out_channels:
+  - 96
+  - 192
+  enable: true
+output_dir: /workspace/camus/train
+resume_from_checkpoint: latest
+save_dir: /workspace/camus/train/20240425-stage2-openpg
+save_model_epoch_interval: 1
+seed: 12580
+snr_gamma: 5.0
+solver:
+  adam_beta1: 0.9
+  adam_beta2: 0.999
+  adam_epsilon: 1.0e-08
+  adam_weight_decay: 0.01
+  enable_xformers_memory_efficient_attention: true
+  gradient_accumulation_steps: 1
+  gradient_checkpointing: true
+  learning_rate: 1.0e-05
+  lr_scheduler: constant
+  lr_warmup_steps: 1
+  max_grad_norm: 1.0
+  max_train_steps: 160000
+  mixed_precision: fp16
+  scale_lr: false
+  use_8bit_adam: true
+stage1_ckpt_dir: /workspace/camus/train/20240418-stage1-openpg-c96_192
+stage1_ckpt_step: 86396
+uncond_ratio: 0.1
+vae_model_path: ./pretrained_weights/sd-vae-ft-mse
+val:
+  validation_steps: 1000
+validation:
+  metric:
+    generate_frame_range:
+    - 50
+    - 74
+    guidance_scale: 2.4
+    ref_frame: 29
+    seed: 42
+    steps: 20
+    videos:
+    - configs/inference/metric/A1ubDo0PbQS.mp4
+    - configs/inference/metric/oEtwozJ6AoIBJ6oyK6rAAQGAOiEWIQixF2F2fB.mp4
+    - configs/inference/metric/oEOgTIKvy7lAQIfZ37E5BFmCVBID3gIQUQfMdv.mp4
+    - configs/inference/metric/ocQoBObnUgBnVskCnPe41sYRiBcAFD5f8AN1Rg.mp4
+  pose_range:
+  - 24
+  - 48
+  test_cases:
+  - - ./configs/inference/ref_images/anyone-2.png
+    - ./configs/inference/metric/91HzMhq7eOS.mp4
+  uniform_along_time: false
+weight_dtype: fp16

20240428-stage2-6k/config.yaml ADDED Viewed

	@@ -0,0 +1,97 @@

+base_model_path: ./pretrained_weights/stable-diffusion-v1-5
+checkpointing_steps: 2000
+data:
+  crop_scale:
+  - 1
+  - 1
+  do_center_crop: false
+  meta_paths:
+  - /workspace/develop/video/data/ubc_tiktok-dropout0.03/ubc-meta.json
+  - /workspace/develop/video/data/tiktok-dance/good-meta.json
+  - /workspace/develop/video/data/20240321/meta.json
+  - /workspace/develop/video/data/20240327/meta.json
+  n_sample_frames: 24
+  ref_augment:
+    pan:
+    - 0.04
+    - 0.04
+    rotate: 2
+    scale:
+    - 0.9
+    - 1.2
+  sample_rate: 4
+  train_bs: 1
+  train_height: 960
+  train_width: 640
+enable_zero_snr: true
+exp_name: stage2-6k
+image_encoder_path: ./pretrained_weights/sd-image-variations-diffusers/image_encoder
+mm_path: ./pretrained_weights/mm_sd_v15_v2.ckpt
+noise_offset: 0.05
+noise_scheduler_kwargs:
+  beta_end: 0.012
+  beta_schedule: linear
+  beta_start: 0.00085
+  clip_sample: false
+  num_train_timesteps: 1000
+  steps_offset: 1
+output_dir: /workspace/camus/train
+resume_from_checkpoint: latest
+save_dir: /workspace/camus/train/20240428-stage2-6k
+save_model_epoch_interval: 1
+seed: 12580
+snr_gamma: 5.0
+solver:
+  adam_beta1: 0.9
+  adam_beta2: 0.999
+  adam_epsilon: 1.0e-08
+  adam_weight_decay: 0.01
+  enable_xformers_memory_efficient_attention: true
+  gradient_accumulation_steps: 1
+  gradient_checkpointing: true
+  learning_rate: 1.0e-05
+  lr_scheduler: constant
+  lr_warmup_steps: 1
+  max_grad_norm: 1.0
+  max_train_steps: 160000
+  mixed_precision: fp16
+  scale_lr: false
+  use_8bit_adam: true
+stage1_ckpt_dir: /workspace/camus/train/20240421-stage1-6k
+stage1_ckpt_step: 78782
+uncond_ratio: 0.1
+vae_model_path: ./pretrained_weights/sd-vae-ft-mse
+val:
+  validation_steps: 1000
+validation:
+  metric:
+    generate_frame_range:
+    - 30
+    - 54
+    guidance_scale: 2.8
+    ref_frame: 29
+    seed: 42
+    steps: 30
+    videos:
+    - configs/inference/metric/oATCBbieJIB8u3QAMAUwvMi9ymEOIc1AoDOajA.mp4
+    - configs/inference/metric/oonQq0HjAC7ExkJlRSMBBs1q3EIiQgFveLD7fD.mp4
+    - configs/inference/metric/os0aLDIkagGgAfAFQsfICCWMuoL8jm3IgJ0Wey.mp4
+    - configs/inference/metric/oYflAvAyfAIFRf3yQDrLRDCWcEDoFENF9tBEgg.mp4
+  pose_range:
+  - 0
+  - 24
+  test_cases:
+  - - ./configs/inference/ref_images/anyone-3.png
+    - ./configs/inference/pose_videos/demo18.mp4
+  - - ./configs/inference/ref_images/anyone-3-partial.png
+    - ./configs/inference/pose_videos/demo6.mp4
+  - - ./configs/inference/ref_images/anyone-2.png
+    - ./configs/inference/pose_videos/demo11.mp4
+  - - ./configs/inference/ref_images/anyone-1.png
+    - ./configs/inference/pose_videos/demo11.mp4
+  - - ./configs/inference/ref_images/anyone-5.png
+    - ./configs/inference/pose_videos/demo11.mp4
+  - - ./configs/inference/ref_images/anyone-11.png
+    - ./configs/inference/pose_videos/demo15.mp4
+  uniform_along_time: false
+weight_dtype: fp16

20240504-stage1-51k-raw-opg/config.yaml ADDED Viewed

	@@ -0,0 +1,105 @@

+base_model_path: ./pretrained_weights/sd-image-variations-diffusers
+checkpointing_steps: 1000
+controlnet_openpose_path: ./pretrained_weights/control_v11p_sd15_openpose/diffusion_pytorch_model.bin
+data:
+  crop_scale:
+  - 0.8
+  - 1.2
+  do_center_crop: false
+  meta_paths:
+  - /workspace/develop/video/data/202403raw/meta.json
+  ref_augment:
+    downsample:
+      min_scale_logit: -1.2
+      p: 0.3
+    pan:
+    - 0.04
+    - 0.02
+    rotate: 8
+    scale:
+    - 0.9
+    - 1.2
+  sample_margin: 30
+  train_bs: 4
+  train_height: 1152
+  train_width: 768
+enable_zero_snr: true
+exp_name: stage1-51k-raw-opg
+freeze_denoise: false
+freeze_reference: false
+image_encoder_path: ./pretrained_weights/sd-image-variations-diffusers/image_encoder
+noise_offset: 0.05
+noise_scheduler_kwargs:
+  beta_end: 0.012
+  beta_schedule: scaled_linear
+  beta_start: 0.00085
+  clip_sample: false
+  num_train_timesteps: 1000
+  steps_offset: 1
+openpose_guider:
+  block_out_channels:
+  - 96
+  - 192
+  enable: true
+  model_path: ./pretrained_weights/body_pose_model.pth
+output_dir: /workspace/camus/train
+pose_guider_pretrain: true
+resume_from_checkpoint: latest
+save_dir: /workspace/camus/train/20240504-stage1-51k-raw-opg
+save_model_epoch_interval: 1
+seed: 12580
+snr_gamma: 5.0
+solver:
+  adam_beta1: 0.9
+  adam_beta2: 0.999
+  adam_epsilon: 1.0e-08
+  adam_weight_decay: 0.01
+  enable_xformers_memory_efficient_attention: true
+  gradient_accumulation_steps: 1
+  gradient_checkpointing: false
+  learning_rate: 1.0e-05
+  lr_scheduler: constant
+  lr_warmup_steps: 1
+  max_grad_norm: 1.0
+  max_train_steps: 100000
+  mixed_precision: fp16
+  scale_lr: false
+  use_8bit_adam: false
+uncond_ratio: 0.1
+vae_model_path: ./pretrained_weights/sd-vae-ft-mse
+val:
+  validation_steps: 1000
+validation:
+  metric:
+    batch_size: 4
+    generated_frames:
+    - 16
+    - 45
+    - 98
+    - 150
+    - 188
+    - 220
+    - 268
+    - 300
+    guidance_scale: 1.9
+    ref_frame: 28
+    seed: 42
+    size:
+    - 640
+    - 960
+    steps: 20
+    videos:
+    - configs/inference/metric/91HzMhq7eOS.mp4
+    - configs/inference/metric/A1T-Ea-FlQS.mp4
+    - configs/inference/metric/A1ubDo0PbQS.mp4
+    - configs/inference/metric/A1YNmKj0sCS.mp4
+  pose_image_paths:
+  - configs/inference/ref_images/91c+SL7Cg7S-98.png
+  - configs/inference/ref_images/91c+SL7Cg7S-150.png
+  - configs/inference/ref_images/91c+SL7Cg7S-220.png
+  ref_image_paths:
+  - configs/inference/ref_images/anyone-1.png
+  - configs/inference/ref_images/anyone-2.png
+  - configs/inference/ref_images/anyone-3.png
+  - configs/inference/ref_images/anyone-11.png
+weight_dtype: fp16

20240508-stage1-openpg-nopaf/checkpoint-68000/optimizer.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4992207980f1536bd01774c79570964dc5914869eacdbf4e036e5be6d3a08009
+size 13608730321

20240508-stage1-openpg-nopaf/checkpoint-68000/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:10cba949e36100e45347b68dbb7c450f68f22ca6eddd374135e04a167d349939
+size 7089007643

20240508-stage1-openpg-nopaf/checkpoint-68000/random_states_0.pkl ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:006807bad9ad34cbe6cea8f2852e1958e302fc1d48af87193038df01ebdf7f54
+size 14663

20240508-stage1-openpg-nopaf/checkpoint-68000/scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e8044a6001b7773ad8995c7d8eaca15afedbae86f4988d9021814efe220547b7
+size 557

20240508-stage1-openpg-nopaf/checkpoint-68000/scheduler.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:531528e64a56b148ae89500f53709845c48cc71002664c9dc655272f32520b7a
+size 563

20240508-stage1-openpg-nopaf/checkpoint-69000/optimizer.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5bf4e2162da621736604cc2fb72622ae9bd06c5f62135da6bec546d792f89da2
+size 13608730321

20240508-stage1-openpg-nopaf/checkpoint-69000/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:74feaf9a2826975a96d2148c6768b6a36493b561fc973bda16d11df5d0cbc471
+size 7089007643

20240508-stage1-openpg-nopaf/checkpoint-69000/random_states_0.pkl ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a2fbfcb40a710a5f4392303e002cc3301bc6a3cb5f094e119b47fb82ff721292
+size 14727

20240508-stage1-openpg-nopaf/checkpoint-69000/scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d27fb664e5da2431936336dcfd332b3f059d007cac2905bf45738234c84c3618
+size 557

20240508-stage1-openpg-nopaf/checkpoint-69000/scheduler.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0f47d91314bb33995bbc73a56304786baf645f2d50ad3fd39f0b8c360b7e8e85
+size 563

20240508-stage1-openpg-nopaf/config.yaml ADDED Viewed

	@@ -0,0 +1,108 @@

+base_model_path: ./pretrained_weights/sd-image-variations-diffusers
+checkpointing_steps: 1000
+data:
+  crop_scale:
+  - 0.8
+  - 1.2
+  do_center_crop: false
+  meta_paths:
+  - /workspace/develop/video/data/ubc_tiktok-dropout0.03/ubc-meta.json
+  - /workspace/develop/video/data/tiktok-dance/good-meta.json
+  - /workspace/develop/video/data/20240321/meta.json
+  - /workspace/develop/video/data/20240327/meta.json
+  ref_augment:
+    downsample:
+      min_scale_logit: -1.2
+      p: 0.3
+    pan:
+    - 0.04
+    - 0.02
+    rotate: 8
+    scale:
+    - 0.9
+    - 1.2
+  sample_margin: 30
+  train_bs: 4
+  train_height: 1152
+  train_width: 768
+enable_zero_snr: true
+exp_name: stage1-openpg-nopaf
+image_encoder_path: ./pretrained_weights/sd-image-variations-diffusers/image_encoder
+noise_offset: 0.05
+noise_scheduler_kwargs:
+  beta_end: 0.012
+  beta_schedule: scaled_linear
+  beta_start: 0.00085
+  clip_sample: false
+  num_train_timesteps: 1000
+  steps_offset: 1
+openpose_guider:
+  block_out_channels:
+  - 96
+  - 192
+  enable: true
+  exclude_paf: true
+  model_path: ./pretrained_weights/body_pose_model.pth
+output_dir: /workspace/camus/train
+pose_guider_pretrain: false
+resume_from_checkpoint: latest
+save_dir: /workspace/camus/train/20240508-stage1-openpg-nopaf
+save_model_epoch_interval: 1
+seed: 12580
+snr_gamma: 5.0
+solver:
+  adam_beta1: 0.9
+  adam_beta2: 0.999
+  adam_epsilon: 1.0e-08
+  adam_weight_decay: 0.01
+  enable_xformers_memory_efficient_attention: true
+  gradient_accumulation_steps: 1
+  gradient_checkpointing: false
+  learning_rate: 1.0e-05
+  lr_scheduler: constant
+  lr_warmup_steps: 1
+  max_grad_norm: 1.0
+  max_train_steps: 100000
+  mixed_precision: fp16
+  scale_lr: false
+  use_8bit_adam: false
+uncond_ratio: 0.1
+vae_model_path: ./pretrained_weights/sd-vae-ft-mse
+val:
+  special_steps:
+  - 200
+  validation_steps: 1000
+validation:
+  metric:
+    batch_size: 4
+    generated_frames:
+    - 16
+    - 45
+    - 98
+    - 150
+    - 188
+    - 220
+    - 268
+    - 300
+    guidance_scale: 2.8
+    ref_frame: 28
+    seed: 42
+    size:
+    - 640
+    - 960
+    steps: 20
+    videos:
+    - configs/inference/metric/91HzMhq7eOS.mp4
+    - configs/inference/metric/A1T-Ea-FlQS.mp4
+    - configs/inference/metric/A1ubDo0PbQS.mp4
+    - configs/inference/metric/A1YNmKj0sCS.mp4
+  pose_image_paths:
+  - configs/inference/ref_images/91c+SL7Cg7S-98.png
+  - configs/inference/ref_images/91c+SL7Cg7S-150.png
+  - configs/inference/ref_images/91c+SL7Cg7S-220.png
+  ref_image_paths:
+  - configs/inference/ref_images/anyone-1.png
+  - configs/inference/ref_images/anyone-2.png
+  - configs/inference/ref_images/anyone-3.png
+  - configs/inference/ref_images/anyone-11.png
+weight_dtype: fp16

20240508-stage1-openpg-nopaf/denoising_unet-65381.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c863d62ce3d4338a23eb0d144e810b4a88eb9c1ce505f574bfdf5601244af887
+size 3438374293

20240508-stage1-openpg-nopaf/denoising_unet-66980.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:52632f6c8100a3b591211b521af2a55238f3bc8f405e07813fba81d64fd4bee2
+size 3438374293

20240508-stage1-openpg-nopaf/denoising_unet-68579.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b981a2f1da3c8079614b855d4912b1893dc11ea45d693722c6825c2b4de0b77e
+size 3438374293

20240508-stage1-openpg-nopaf/pose_guider-65381.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e1f8aca9ca3f12cf87678561cc385c2a2240f6342645212fe4d1eaf6f5d63c65
+size 212263301

20240508-stage1-openpg-nopaf/pose_guider-66980.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:28e32fd312ab48515f8d6c89987a60075a57400493754999fd7a54dea28c6930
+size 212263301

20240508-stage1-openpg-nopaf/pose_guider-68579.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2fb06215f0e5c360108d597cdbb069d414c8520909b800f548dd7e1f449fbe21
+size 212263301

20240508-stage1-openpg-nopaf/reference_unet-65381.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:42ded4e21f6a816dc1520f8d17ab9aebfe6fe274462a3e22d4c9de156da7c78a
+size 3438323817

20240508-stage1-openpg-nopaf/reference_unet-66980.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c6cb760f41afd9af4aba70e3baecad276883c3047f1ffe435a12b780d7054df5
+size 3438323817

20240508-stage1-openpg-nopaf/reference_unet-68579.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:64466c7b2fc2d6d3a180e33cd392f33edda3c1e9223b9dc824a324d9f722cd75
+size 3438323817

20240510-stage1-9k/config.yaml ADDED Viewed

	@@ -0,0 +1,105 @@

+base_model_path: ./pretrained_weights/sd-image-variations-diffusers
+checkpointing_steps: 1000
+controlnet_openpose_path: ./pretrained_weights/control_v11p_sd15_openpose/diffusion_pytorch_model.bin
+data:
+  crop_scale:
+  - 0.8
+  - 1.2
+  do_center_crop: false
+  meta_paths:
+  - /workspace/develop/video/data/ubc_tiktok-dropout0.03/ubc-meta.json
+  - /workspace/develop/video/data/tiktok-dance/good-meta.json
+  - /workspace/develop/video/data/20240321/meta.json
+  - /workspace/develop/video/data/20240327/meta.json
+  - /workspace/develop/video/data/20240506/meta.json
+  - /workspace/develop/video/data/20240509/meta.json
+  ref_augment:
+    downsample:
+      min_scale_logit: -1.2
+      p: 0.3
+    pan:
+    - 0.04
+    - 0.02
+    rotate: 8
+    scale:
+    - 0.9
+    - 1.2
+  sample_margin: 30
+  train_bs: 4
+  train_height: 1152
+  train_width: 768
+enable_zero_snr: true
+exp_name: stage1-9k
+freeze_denoise: false
+freeze_reference: false
+image_encoder_path: ./pretrained_weights/sd-image-variations-diffusers/image_encoder
+noise_offset: 0.05
+noise_scheduler_kwargs:
+  beta_end: 0.012
+  beta_schedule: scaled_linear
+  beta_start: 0.00085
+  clip_sample: false
+  num_train_timesteps: 1000
+  steps_offset: 1
+openpose_guider:
+  enable: false
+output_dir: /workspace/camus/train
+pose_guider_pretrain: true
+resume_from_checkpoint: ''
+save_model_epoch_interval: 1
+seed: 12580
+snr_gamma: 5.0
+solver:
+  adam_beta1: 0.9
+  adam_beta2: 0.999
+  adam_epsilon: 1.0e-08
+  adam_weight_decay: 0.01
+  enable_xformers_memory_efficient_attention: true
+  gradient_accumulation_steps: 1
+  gradient_checkpointing: false
+  learning_rate: 1.0e-05
+  lr_scheduler: constant
+  lr_warmup_steps: 1
+  max_grad_norm: 1.0
+  max_train_steps: 100000
+  mixed_precision: fp16
+  scale_lr: false
+  use_8bit_adam: false
+uncond_ratio: 0.1
+vae_model_path: ./pretrained_weights/sd-vae-ft-mse
+val:
+  validation_steps: 1000
+validation:
+  metric:
+    batch_size: 4
+    generated_frames:
+    - 16
+    - 45
+    - 98
+    - 150
+    - 188
+    - 220
+    - 268
+    - 300
+    guidance_scale: 1.9
+    ref_frame: 28
+    seed: 42
+    size:
+    - 640
+    - 960
+    steps: 20
+    videos:
+    - configs/inference/metric/91HzMhq7eOS.mp4
+    - configs/inference/metric/A1T-Ea-FlQS.mp4
+    - configs/inference/metric/A1ubDo0PbQS.mp4
+    - configs/inference/metric/A1YNmKj0sCS.mp4
+  pose_image_paths:
+  - configs/inference/pose_images/A1eEZvfJRUS/frame70.png
+  - configs/inference/pose_images/A1eEZvfJRUS/frame150.png
+  - configs/inference/pose_images/A1eEZvfJRUS/frame190.png
+  ref_image_paths:
+  - configs/inference/ref_images/anyone-1.png
+  - configs/inference/ref_images/anyone-2.png
+  - configs/inference/ref_images/anyone-3.png
+  - configs/inference/ref_images/anyone-11.png
+weight_dtype: fp16

20240513-stage2-9k/config.yaml ADDED Viewed

	@@ -0,0 +1,99 @@

+base_model_path: ./pretrained_weights/stable-diffusion-v1-5
+checkpointing_steps: 2000
+data:
+  crop_scale:
+  - 1
+  - 1
+  do_center_crop: false
+  meta_paths:
+  - /workspace/develop/video/data/ubc_tiktok-dropout0.03/ubc-meta.json
+  - /workspace/develop/video/data/tiktok-dance/good-meta.json
+  - /workspace/develop/video/data/20240321/meta.json
+  - /workspace/develop/video/data/20240327/meta.json
+  - /workspace/develop/video/data/20240506/meta.json
+  - /workspace/develop/video/data/20240509/meta.json
+  n_sample_frames: 24
+  ref_augment:
+    pan:
+    - 0.04
+    - 0.04
+    rotate: 2
+    scale:
+    - 0.9
+    - 1.2
+  sample_rate: 4
+  train_bs: 1
+  train_height: 960
+  train_width: 640
+enable_zero_snr: true
+exp_name: stage2-9k
+image_encoder_path: ./pretrained_weights/sd-image-variations-diffusers/image_encoder
+mm_path: ./pretrained_weights/mm_sd_v15_v2.ckpt
+noise_offset: 0.05
+noise_scheduler_kwargs:
+  beta_end: 0.012
+  beta_schedule: linear
+  beta_start: 0.00085
+  clip_sample: false
+  num_train_timesteps: 1000
+  steps_offset: 1
+output_dir: /workspace/camus/train
+resume_from_checkpoint: ''
+save_dir: /workspace/camus/train/20240513-stage2-9k
+save_model_epoch_interval: 1
+seed: 12580
+snr_gamma: 5.0
+solver:
+  adam_beta1: 0.9
+  adam_beta2: 0.999
+  adam_epsilon: 1.0e-08
+  adam_weight_decay: 0.01
+  enable_xformers_memory_efficient_attention: true
+  gradient_accumulation_steps: 1
+  gradient_checkpointing: true
+  learning_rate: 1.0e-05
+  lr_scheduler: constant
+  lr_warmup_steps: 1
+  max_grad_norm: 1.0
+  max_train_steps: 160000
+  mixed_precision: fp16
+  scale_lr: false
+  use_8bit_adam: true
+stage1_ckpt_dir: /workspace/camus/train/20240510-stage1-9k
+stage1_ckpt_step: 75392
+uncond_ratio: 0.1
+vae_model_path: ./pretrained_weights/sd-vae-ft-mse
+val:
+  validation_steps: 1000
+validation:
+  metric:
+    generate_frame_range:
+    - 30
+    - 54
+    guidance_scale: 2.8
+    ref_frame: 29
+    seed: 42
+    steps: 30
+    videos:
+    - configs/inference/metric/oATCBbieJIB8u3QAMAUwvMi9ymEOIc1AoDOajA.mp4
+    - configs/inference/metric/oonQq0HjAC7ExkJlRSMBBs1q3EIiQgFveLD7fD.mp4
+    - configs/inference/metric/os0aLDIkagGgAfAFQsfICCWMuoL8jm3IgJ0Wey.mp4
+    - configs/inference/metric/oYflAvAyfAIFRf3yQDrLRDCWcEDoFENF9tBEgg.mp4
+  pose_range:
+  - 0
+  - 24
+  test_cases:
+  - - ./configs/inference/ref_images/anyone-3.png
+    - ./configs/inference/pose_videos/demo18.mp4
+  - - ./configs/inference/ref_images/anyone-3-partial.png
+    - ./configs/inference/pose_videos/demo6.mp4
+  - - ./configs/inference/ref_images/anyone-2.png
+    - ./configs/inference/pose_videos/demo11.mp4
+  - - ./configs/inference/ref_images/anyone-1.png
+    - ./configs/inference/pose_videos/demo11.mp4
+  - - ./configs/inference/ref_images/anyone-5.png
+    - ./configs/inference/pose_videos/demo11.mp4
+  - - ./configs/inference/ref_images/anyone-11.png
+    - ./configs/inference/pose_videos/demo15.mp4
+  uniform_along_time: false
+weight_dtype: fp16