FLUX.1-Kontext-Dev

Running on Zero

cbensimon HF Staff commited on Jul 16

Commit

2e80751

verified ·

1 Parent(s): 8d1790b

Remove quantization

Files changed (1) hide show

optimization.py CHANGED Viewed

@@ -4,8 +4,6 @@
 import spaces
 import torch
 from diffusers.pipelines.flux.pipeline_flux import FluxPipeline
-from torchao.quantization import quantize_
-from torchao.quantization import Float8DynamicActivationFloat8WeightConfig
 from zerogpu import aoti_compile
@@ -43,7 +41,6 @@ def optimize_pipeline_(pipeline: FluxPipeline):
     @spaces.GPU(duration=1500)
     def compile_transformer():
         pipeline.transformer.fuse_qkv_projections()
-        quantize_(pipeline.transformer, Float8DynamicActivationFloat8WeightConfig())
         exported = torch.export.export(pipeline.transformer, args=(), kwargs=transformer_kwargs)
         return aoti_compile(exported, inductor_configs)

 import spaces
 import torch
 from diffusers.pipelines.flux.pipeline_flux import FluxPipeline
 from zerogpu import aoti_compile
     @spaces.GPU(duration=1500)
     def compile_transformer():
         pipeline.transformer.fuse_qkv_projections()
         exported = torch.export.export(pipeline.transformer, args=(), kwargs=transformer_kwargs)
         return aoti_compile(exported, inductor_configs)