custom-diffusion

Build error

App Files Files Community

Nupur Kumari commited on Dec 17, 2022

Commit

1fa5d2c

1 Parent(s): 258d687

custom-diffusion-space

Browse files

Files changed (6) hide show

app.py +35 -26
custom-diffusion-models/cat.bin +3 -0
inference.py +8 -4
lora +0 -1
requirements.txt +1 -0
trainer.py +10 -12

app.py CHANGED Viewed

@@ -19,7 +19,7 @@ from trainer import Trainer
 from uploader import upload
 TITLE = '# Custom Diffusion + StableDiffusion Training UI'
-DESCRIPTION = 'This is an unofficial demo for [https://github.com/adobe-research/custom-diffusion](https://github.com/adobe-research/custom-diffusion).'
 ORIGINAL_SPACE_ID = 'nupurkmr9/custom-diffusion'
 SPACE_ID = os.getenv('SPACE_ID', ORIGINAL_SPACE_ID)
@@ -57,26 +57,27 @@ def create_training_demo(trainer: Trainer,
                          pipe: InferencePipeline) -> gr.Blocks:
     with gr.Blocks() as demo:
         base_model = gr.Dropdown(
-            choices=['stabilityai/stable-diffusion-2-1-base'],
-            value='stabilityai/stable-diffusion-2-1-base',
             label='Base Model',
-            visible=False)
-        resolution = gr.Dropdown(choices=['512'],
                                  value='512',
                                  label='Resolution',
-                                 visible=False)
         with gr.Row():
             with gr.Box():
                 gr.Markdown('Training Data')
                 concept_images = gr.Files(label='Images for your concept')
                 concept_prompt = gr.Textbox(label='Concept Prompt',
-                                            max_lines=1)
                 class_prompt = gr.Textbox(label='Regularization set Prompt',
-                                            max_lines=1)
                 gr.Markdown('''
-                    - Upload images of the style you are planning on training on.
-                    - For a concept prompt, use a unique, made up word to avoid collisions.
                     ''')
             with gr.Box():
                 gr.Markdown('Training Parameters')
@@ -84,16 +85,15 @@ def create_training_demo(trainer: Trainer,
                     label='Number of Training Steps', value=1000, precision=0)
                 learning_rate = gr.Number(label='Learning Rate', value=0.00001)
                 train_text_encoder = gr.Checkbox(label='Train Text Encoder',
-                                                 value=True)
                 modifier_token = gr.Checkbox(label='modifier token',
                                                  value=True)
-                learning_rate_text = gr.Number(
-                    label='Learning Rate for Text Encoder', value=0.00001)
                 gradient_accumulation = gr.Number(
                     label='Number of Gradient Accumulation',
                     value=1,
                     precision=0)
-                fp16 = gr.Checkbox(label='FP16', value=True)
                 use_8bit_adam = gr.Checkbox(label='Use 8bit Adam', value=True)
                 gr.Markdown('''
                     - It will take about 8 minutes to train for 1000 steps with a T4 GPU.
@@ -111,19 +111,22 @@ def create_training_demo(trainer: Trainer,
                         training_status = gr.Markdown()
                     output_files = gr.Files(label='Trained Weight Files')
-        run_button.click(fn=pipe.clear)
         run_button.click(fn=trainer.run,
                          inputs=[
                              base_model,
                              resolution,
                              concept_images,
                              concept_prompt,
                              num_training_steps,
                              learning_rate,
                              train_text_encoder,
-                             learning_rate_text,
                              gradient_accumulation,
-                             fp16,
                              use_8bit_adam,
                          ],
                          outputs=[
@@ -144,8 +147,7 @@ def create_training_demo(trainer: Trainer,
 def find_weight_files() -> list[str]:
     curr_dir = pathlib.Path(__file__).parent
-    paths = sorted(curr_dir.rglob('*.pt'))
-    paths = [path for path in paths if not path.stem.endswith('.text_encoder')]
     return [path.relative_to(curr_dir).as_posix() for path in paths]
@@ -158,18 +160,18 @@ def create_inference_demo(pipe: InferencePipeline) -> gr.Blocks:
         with gr.Row():
             with gr.Column():
                 base_model = gr.Dropdown(
-                    choices=['stabilityai/stable-diffusion-2-1-base'],
-                    value='stabilityai/stable-diffusion-2-1-base',
                     label='Base Model',
-                    visible=False)
                 reload_button = gr.Button('Reload Weight List')
                 weight_name = gr.Dropdown(choices=find_weight_files(),
-                                               value='custom-diffusion/cat.ckpt',
                                                label='Custom Diffusion Weight File')
                 prompt = gr.Textbox(
                     label='Prompt',
                     max_lines=1,
-                    placeholder='Example: "<new1> cat swimming in a pool"')
                 seed = gr.Slider(label='Seed',
                                  minimum=0,
                                  maximum=100000,
@@ -186,16 +188,21 @@ def create_inference_demo(pipe: InferencePipeline) -> gr.Blocks:
                                                maximum=50,
                                                step=0.1,
                                                value=6)
-                    eta = gr.Slider(label='CFG Scale',
                                                minimum=0,
                                                maximum=1.,
                                                step=0.1,
                                                value=1.)
                 run_button = gr.Button('Generate')
                 gr.Markdown('''
-                - Models with names starting with "custom-diffusion/" are the pretrained models provided in the [original repo](https://github.com/adobe-research/custom-diffusion), and the ones with names starting with "results/" are your trained models.
                 - After training, you can press "Reload Weight List" button to load your trained model names.
                 ''')
             with gr.Column():
@@ -213,6 +220,7 @@ def create_inference_demo(pipe: InferencePipeline) -> gr.Blocks:
                           num_steps,
                           guidance_scale,
                           eta,
                       ],
                       outputs=result,
                       queue=False)
@@ -225,6 +233,7 @@ def create_inference_demo(pipe: InferencePipeline) -> gr.Blocks:
                              num_steps,
                              guidance_scale,
                              eta,
                          ],
                          outputs=result,
                          queue=False)

 from uploader import upload
 TITLE = '# Custom Diffusion + StableDiffusion Training UI'
+DESCRIPTION = 'This is a demo for [https://github.com/adobe-research/custom-diffusion](https://github.com/adobe-research/custom-diffusion).'
 ORIGINAL_SPACE_ID = 'nupurkmr9/custom-diffusion'
 SPACE_ID = os.getenv('SPACE_ID', ORIGINAL_SPACE_ID)
                          pipe: InferencePipeline) -> gr.Blocks:
     with gr.Blocks() as demo:
         base_model = gr.Dropdown(
+            choices=['stabilityai/stable-diffusion-2-1-base', 'CompVis/stable-diffusion-v1-4'],
+            value='CompVis/stable-diffusion-v1-4',
             label='Base Model',
+            visible=True)
+        resolution = gr.Dropdown(choices=['512', '768'],
                                  value='512',
                                  label='Resolution',
+                                 visible=True)
         with gr.Row():
             with gr.Box():
                 gr.Markdown('Training Data')
                 concept_images = gr.Files(label='Images for your concept')
                 concept_prompt = gr.Textbox(label='Concept Prompt',
+                                            max_lines=1, placeholder='Example: "photo of a \<new1\> cat"')
                 class_prompt = gr.Textbox(label='Regularization set Prompt',
+                                            max_lines=1, placeholder='Example: "cat"')
                 gr.Markdown('''
+                    - We use "\<new1\>" appended in front of the concept. E.g. "\<new1\> cat".
+                    - For a new concept, use "photo of a \<new1\> cat" for concept_prompt and "cat" for class_prompt.
+                    - For a style concept, use "painting in the style of \<new1\> art" for concept_prompt and "art" for class_prompt.
                     ''')
             with gr.Box():
                 gr.Markdown('Training Parameters')
                     label='Number of Training Steps', value=1000, precision=0)
                 learning_rate = gr.Number(label='Learning Rate', value=0.00001)
                 train_text_encoder = gr.Checkbox(label='Train Text Encoder',
+                                                 value=False)
                 modifier_token = gr.Checkbox(label='modifier token',
                                                  value=True)
+                batch_size = gr.Number(
+                    label='batch_size', value=1, precision=0)
                 gradient_accumulation = gr.Number(
                     label='Number of Gradient Accumulation',
                     value=1,
                     precision=0)
                 use_8bit_adam = gr.Checkbox(label='Use 8bit Adam', value=True)
                 gr.Markdown('''
                     - It will take about 8 minutes to train for 1000 steps with a T4 GPU.
                         training_status = gr.Markdown()
                     output_files = gr.Files(label='Trained Weight Files')
+        # run_button.click(fn=pipe.clear,
+        #                     inputs=None,
+        #                     outputs=None,)
         run_button.click(fn=trainer.run,
                          inputs=[
                              base_model,
                              resolution,
                              concept_images,
                              concept_prompt,
+                             class_prompt,
                              num_training_steps,
                              learning_rate,
                              train_text_encoder,
+                             modifier_token,
                              gradient_accumulation,
+                             batch_size,
                              use_8bit_adam,
                          ],
                          outputs=[
 def find_weight_files() -> list[str]:
     curr_dir = pathlib.Path(__file__).parent
+    paths = sorted(curr_dir.rglob('*.bin'))
     return [path.relative_to(curr_dir).as_posix() for path in paths]
         with gr.Row():
             with gr.Column():
                 base_model = gr.Dropdown(
+                    choices=['stabilityai/stable-diffusion-2-1-base', 'CompVis/stable-diffusion-v1-4'],
+                    value='CompVis/stable-diffusion-v1-4',
                     label='Base Model',
+                    visible=True)
                 reload_button = gr.Button('Reload Weight List')
                 weight_name = gr.Dropdown(choices=find_weight_files(),
+                                               value='custom-diffusion-models/cat.bin',
                                                label='Custom Diffusion Weight File')
                 prompt = gr.Textbox(
                     label='Prompt',
                     max_lines=1,
+                    placeholder='Example: "\<new1\> cat in outer space"')
                 seed = gr.Slider(label='Seed',
                                  minimum=0,
                                  maximum=100000,
                                                maximum=50,
                                                step=0.1,
                                                value=6)
+                    eta = gr.Slider(label='DDIM eta',
                                                minimum=0,
                                                maximum=1.,
                                                step=0.1,
                                                value=1.)
+                    batch_size = gr.Slider(label='Batch Size',
+                                               minimum=0,
+                                               maximum=10.,
+                                               step=1,
+                                               value=2)
                 run_button = gr.Button('Generate')
                 gr.Markdown('''
+                - Models with names starting with "custom-diffusion-models/" are the pretrained models provided in the [original repo](https://github.com/adobe-research/custom-diffusion), and the ones with names starting with "results/" are your trained models.
                 - After training, you can press "Reload Weight List" button to load your trained model names.
                 ''')
             with gr.Column():
                           num_steps,
                           guidance_scale,
                           eta,
+                          batch_size,
                       ],
                       outputs=result,
                       queue=False)
                              num_steps,
                              guidance_scale,
                              eta,
+                             batch_size,
                          ],
                          outputs=result,
                          queue=False)

custom-diffusion-models/cat.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:08754e711b9ecaa36785dc64ad0c08317a93d106629c5f42cc5b9a406fe4aefc
+size 76690626

inference.py CHANGED Viewed

@@ -6,11 +6,12 @@ import sys
 import gradio as gr
 import PIL.Image
 import torch
 from diffusers import StableDiffusionPipeline
 sys.path.insert(0, 'custom-diffusion')
-from src import sample_diffuser, diffuser_training
 class InferencePipeline:
@@ -59,6 +60,7 @@ class InferencePipeline:
         n_steps: int,
         guidance_scale: float,
         eta: float,
     ) -> PIL.Image.Image:
         if not torch.cuda.is_available():
             raise gr.Error('CUDA is not available.')
@@ -66,9 +68,11 @@ class InferencePipeline:
         self.load_pipe(base_model, weight_name)
         generator = torch.Generator(device=self.device).manual_seed(seed)
-        out = self.pipe(prompt,
                         num_inference_steps=n_steps,
                         guidance_scale=guidance_scale,
                         eta = eta,
                         generator=generator)  # type: ignore
-        return out.images[0]

 import gradio as gr
 import PIL.Image
+import numpy as np
 import torch
 from diffusers import StableDiffusionPipeline
 sys.path.insert(0, 'custom-diffusion')
+from src import diffuser_training
 class InferencePipeline:
         n_steps: int,
         guidance_scale: float,
         eta: float,
+        batch_size: int,
     ) -> PIL.Image.Image:
         if not torch.cuda.is_available():
             raise gr.Error('CUDA is not available.')
         self.load_pipe(base_model, weight_name)
         generator = torch.Generator(device=self.device).manual_seed(seed)
+        out = self.pipe([prompt]*batch_size,
                         num_inference_steps=n_steps,
                         guidance_scale=guidance_scale,
                         eta = eta,
                         generator=generator)  # type: ignore
+        out = out.images
+        out = PIL.Image.fromarray(np.hstack([np.array(x) for x in out]))
+        return out

lora DELETED Viewed

	@@ -1 +0,0 @@
1	- Subproject commit 26787a09bff4ebcb08f0ad4e848b67bce4389a7a

requirements.txt CHANGED Viewed

@@ -8,3 +8,4 @@ torchvision==0.14.0
 transformers==4.25.1
 triton==2.0.0.dev20220701
 xformers==0.0.13

 transformers==4.25.1
 triton==2.0.0.dev20220701
 xformers==0.0.13
+clip_retrieval

trainer.py CHANGED Viewed

@@ -65,10 +65,9 @@ class Trainer:
         n_steps: int,
         learning_rate: float,
         train_text_encoder: bool,
-        learning_rate_text: float,
         gradient_accumulation: int,
-        batch-size: int,
-        fp16: bool,
         use_8bit_adam: bool,
     ) -> tuple[dict, list[pathlib.Path]]:
         if not torch.cuda.is_available():
@@ -91,28 +90,27 @@ class Trainer:
         accelerate launch custom-diffusion/src/diffuser_training.py \
           --pretrained_model_name_or_path={base_model}   \
           --instance_data_dir={self.instance_data_dir}  \
-          --class_data_dir={self.class_data_dir} \
           --output_dir={self.output_dir} \
-          --with_prior_preservation --prior_loss_weight=1.0 \
           --instance_prompt="{concept_prompt}" \
           --class_prompt="{class_prompt}" \
           --resolution={resolution}  \
-          --train_batch_size={batch-size}  \
           --gradient_accumulation_steps={gradient_accumulation}  \
           --learning_rate={learning_rate}  \
           --lr_scheduler="constant" \
           --lr_warmup_steps=0 \
           --max_train_steps={n_steps} \
           --num_class_images=200 \
-          --scale_lr \
-          --modifier_token "<new1>"
         '''
-        if fp16:
-            command += ' --mixed_precision fp16'
         if use_8bit_adam:
             command += ' --use_8bit_adam'
         if train_text_encoder:
-            command += f' --train_text_encoder --learning_rate_text={learning_rate_text}'
         with open(self.output_dir / 'train.sh', 'w') as f:
             command_s = ' '.join(command.split())
@@ -126,5 +124,5 @@ class Trainer:
             result_message = 'Training Completed!'
         else:
             result_message = 'Training Failed!'
-        weight_paths = sorted(self.output_dir.glob('*.pt'))
         return gr.update(value=result_message), weight_paths

         n_steps: int,
         learning_rate: float,
         train_text_encoder: bool,
+        modifier_token: bool,
         gradient_accumulation: int,
+        batch_size: int,
         use_8bit_adam: bool,
     ) -> tuple[dict, list[pathlib.Path]]:
         if not torch.cuda.is_available():
         accelerate launch custom-diffusion/src/diffuser_training.py \
           --pretrained_model_name_or_path={base_model}   \
           --instance_data_dir={self.instance_data_dir}  \
           --output_dir={self.output_dir} \
           --instance_prompt="{concept_prompt}" \
+          --class_data_dir={self.class_data_dir} \
+          --with_prior_preservation --real_prior --prior_loss_weight=1.0 \
           --class_prompt="{class_prompt}" \
           --resolution={resolution}  \
+          --train_batch_size={batch_size}  \
           --gradient_accumulation_steps={gradient_accumulation}  \
           --learning_rate={learning_rate}  \
           --lr_scheduler="constant" \
           --lr_warmup_steps=0 \
           --max_train_steps={n_steps} \
           --num_class_images=200 \
+          --scale_lr
         '''
+        if modifier_token:
+            command += ' --modifier_token "<new1>"'
         if use_8bit_adam:
             command += ' --use_8bit_adam'
         if train_text_encoder:
+            command += f' --train_text_encoder'
         with open(self.output_dir / 'train.sh', 'w') as f:
             command_s = ' '.join(command.split())
             result_message = 'Training Completed!'
         else:
             result_message = 'Training Failed!'
+        weight_paths = sorted(self.output_dir.glob('*.bin'))
         return gr.update(value=result_message), weight_paths