Update README.md
Browse files
README.md
CHANGED
|
@@ -96,7 +96,7 @@ Script for the TransDiff-L 1StepAR setting (Pretrain TransDiff-L with a width of
|
|
| 96 |
torchrun --nproc_per_node=8 --nnodes=8 --node_rank=${NODE_RANK} --master_addr=${MASTER_ADDR} --master_port=${MASTER_PORT} \
|
| 97 |
main.py \
|
| 98 |
--img_size 256 --vae_path ckpt/vae/kl16.ckpt --vae_embed_dim 16 --patch_size 1 \
|
| 99 |
-
--model transdiff_large
|
| 100 |
--diffusion_batch_mul 4 \
|
| 101 |
--epochs 800 --warmup_epochs 100 --blr 1.0e-4 --batch_size 32 \
|
| 102 |
--output_dir ${OUTPUT_DIR} --resume ${OUTPUT_DIR} \
|
|
@@ -112,8 +112,8 @@ Script for the TransDiff-L MRAR setting (Finetune TransDiff-L MRAR with a width
|
|
| 112 |
```
|
| 113 |
torchrun --nproc_per_node=8 --nnodes=8 --node_rank=${NODE_RANK} --master_addr=${MASTER_ADDR} --master_port=${MASTER_PORT} \
|
| 114 |
main.py \
|
| 115 |
-
--img_size 256 --vae_path ckpt/vae/kl16.ckpt --vae_embed_dim 16 --patch_size
|
| 116 |
-
--model transdiff_large --
|
| 117 |
--diffusion_batch_mul 2 \
|
| 118 |
--epochs 40 --warmup_epochs 10 --lr 5.0e-5 --batch_size 16 --gradient_accumulation_steps 2 \
|
| 119 |
--output_dir ${OUTPUT_DIR} --resume ${Transdiff-L_1StepAR_DIR} \
|
|
@@ -124,7 +124,7 @@ Script for the TransDiff-L 512x512 setting (Finetune TransDiff-L 512x512 with a
|
|
| 124 |
torchrun --nproc_per_node=8 --nnodes=8 --node_rank=${NODE_RANK} --master_addr=${MASTER_ADDR} --master_port=${MASTER_PORT} \
|
| 125 |
main.py \
|
| 126 |
--img_size 512 --vae_path ckpt/vae/kl16.ckpt --vae_embed_dim 16 --patch_size 1 \
|
| 127 |
-
--model transdiff_large --
|
| 128 |
--diffusion_batch_mul 4 \
|
| 129 |
--epochs 150 --warmup_epochs 10 --lr 1.0e-4 --batch_size 16 --gradient_accumulation_steps 2 \
|
| 130 |
--only_train_diff \
|
|
@@ -139,7 +139,7 @@ Evaluate TransDiff-L 1StepAR with classifier-free guidance:
|
|
| 139 |
torchrun --nproc_per_node=8 --nnodes=1 --node_rank=0 \
|
| 140 |
main.py \
|
| 141 |
--img_size 256 --vae_path ckpt/vae/kl16.ckpt --vae_embed_dim 16 --patch_size 1 \
|
| 142 |
-
--model transdiff_large
|
| 143 |
--output_dir ${OUTPUT_DIR} --resume ckpt/transdiff_l/ \
|
| 144 |
--evaluate --eval_bsz 256 --num_images 50000 \
|
| 145 |
--cfg 1.3 --scale_0 0.89 --scale_1 0.95
|
|
@@ -149,11 +149,11 @@ Evaluate TransDiff-L MRAR with classifier-free guidance:
|
|
| 149 |
```
|
| 150 |
torchrun --nproc_per_node=8 --nnodes=1 --node_rank=0 \
|
| 151 |
main.py \
|
| 152 |
-
--img_size 256 --vae_path ckpt/vae/kl16.ckpt --vae_embed_dim 16 --patch_size
|
| 153 |
-
--model transdiff_large
|
| 154 |
--output_dir ${OUTPUT_DIR} --resume ckpt/transdiff_l_mrar/ \
|
| 155 |
--evaluate --eval_bsz 256 --num_images 50000 \
|
| 156 |
-
--cfg 1.3 --scale_0 0.
|
| 157 |
```
|
| 158 |
|
| 159 |
Evaluate TransDiff-L 512x512 with classifier-free guidance:
|
|
@@ -161,7 +161,7 @@ Evaluate TransDiff-L 512x512 with classifier-free guidance:
|
|
| 161 |
torchrun --nproc_per_node=8 --nnodes=1 --node_rank=0 \
|
| 162 |
main.py \
|
| 163 |
--img_size 512 --vae_path ckpt/vae/kl16.ckpt --vae_embed_dim 16 --patch_size 1 \
|
| 164 |
-
--model transdiff_large
|
| 165 |
--output_dir ${OUTPUT_DIR} --resume ckpt/transdiff_l_512/ \
|
| 166 |
--evaluate --eval_bsz 64 --num_images 50000 \
|
| 167 |
--cfg 1.3 --scale_0 0.87 --scale_1 0.87
|
|
@@ -175,7 +175,7 @@ More settings for Benchmark in paper:
|
|
| 175 |
| TransDiff-L | 1.30 | 0.89 | 0.95 |
|
| 176 |
| TransDiff-H | 1.23 | 0.87 | 0.93 |
|
| 177 |
| TransDiff-B MRAR | 1.30 | 0.87 | 0.91 |
|
| 178 |
-
| TransDiff-L MRAR | 1.30 | 0.
|
| 179 |
| TransDiff-H MRAR | 1.28 | 0.87 | 0.91 |
|
| 180 |
| TransDiff-L 512x512 | 1.30 | 0.87 | 0.87 |
|
| 181 |
|
|
|
|
| 96 |
torchrun --nproc_per_node=8 --nnodes=8 --node_rank=${NODE_RANK} --master_addr=${MASTER_ADDR} --master_port=${MASTER_PORT} \
|
| 97 |
main.py \
|
| 98 |
--img_size 256 --vae_path ckpt/vae/kl16.ckpt --vae_embed_dim 16 --patch_size 1 \
|
| 99 |
+
--model transdiff_large \
|
| 100 |
--diffusion_batch_mul 4 \
|
| 101 |
--epochs 800 --warmup_epochs 100 --blr 1.0e-4 --batch_size 32 \
|
| 102 |
--output_dir ${OUTPUT_DIR} --resume ${OUTPUT_DIR} \
|
|
|
|
| 112 |
```
|
| 113 |
torchrun --nproc_per_node=8 --nnodes=8 --node_rank=${NODE_RANK} --master_addr=${MASTER_ADDR} --master_port=${MASTER_PORT} \
|
| 114 |
main.py \
|
| 115 |
+
--img_size 256 --vae_path ckpt/vae/kl16.ckpt --vae_embed_dim 16 --patch_size 2 \
|
| 116 |
+
--model transdiff_large --mrar --bf16 \
|
| 117 |
--diffusion_batch_mul 2 \
|
| 118 |
--epochs 40 --warmup_epochs 10 --lr 5.0e-5 --batch_size 16 --gradient_accumulation_steps 2 \
|
| 119 |
--output_dir ${OUTPUT_DIR} --resume ${Transdiff-L_1StepAR_DIR} \
|
|
|
|
| 124 |
torchrun --nproc_per_node=8 --nnodes=8 --node_rank=${NODE_RANK} --master_addr=${MASTER_ADDR} --master_port=${MASTER_PORT} \
|
| 125 |
main.py \
|
| 126 |
--img_size 512 --vae_path ckpt/vae/kl16.ckpt --vae_embed_dim 16 --patch_size 1 \
|
| 127 |
+
--model transdiff_large --ema_rate 0.999 --bf16 \
|
| 128 |
--diffusion_batch_mul 4 \
|
| 129 |
--epochs 150 --warmup_epochs 10 --lr 1.0e-4 --batch_size 16 --gradient_accumulation_steps 2 \
|
| 130 |
--only_train_diff \
|
|
|
|
| 139 |
torchrun --nproc_per_node=8 --nnodes=1 --node_rank=0 \
|
| 140 |
main.py \
|
| 141 |
--img_size 256 --vae_path ckpt/vae/kl16.ckpt --vae_embed_dim 16 --patch_size 1 \
|
| 142 |
+
--model transdiff_large \
|
| 143 |
--output_dir ${OUTPUT_DIR} --resume ckpt/transdiff_l/ \
|
| 144 |
--evaluate --eval_bsz 256 --num_images 50000 \
|
| 145 |
--cfg 1.3 --scale_0 0.89 --scale_1 0.95
|
|
|
|
| 149 |
```
|
| 150 |
torchrun --nproc_per_node=8 --nnodes=1 --node_rank=0 \
|
| 151 |
main.py \
|
| 152 |
+
--img_size 256 --vae_path ckpt/vae/kl16.ckpt --vae_embed_dim 16 --patch_size 2 \
|
| 153 |
+
--model transdiff_large \
|
| 154 |
--output_dir ${OUTPUT_DIR} --resume ckpt/transdiff_l_mrar/ \
|
| 155 |
--evaluate --eval_bsz 256 --num_images 50000 \
|
| 156 |
+
--cfg 1.3 --scale_0 0.925 --scale_1 0.95
|
| 157 |
```
|
| 158 |
|
| 159 |
Evaluate TransDiff-L 512x512 with classifier-free guidance:
|
|
|
|
| 161 |
torchrun --nproc_per_node=8 --nnodes=1 --node_rank=0 \
|
| 162 |
main.py \
|
| 163 |
--img_size 512 --vae_path ckpt/vae/kl16.ckpt --vae_embed_dim 16 --patch_size 1 \
|
| 164 |
+
--model transdiff_large \
|
| 165 |
--output_dir ${OUTPUT_DIR} --resume ckpt/transdiff_l_512/ \
|
| 166 |
--evaluate --eval_bsz 64 --num_images 50000 \
|
| 167 |
--cfg 1.3 --scale_0 0.87 --scale_1 0.87
|
|
|
|
| 175 |
| TransDiff-L | 1.30 | 0.89 | 0.95 |
|
| 176 |
| TransDiff-H | 1.23 | 0.87 | 0.93 |
|
| 177 |
| TransDiff-B MRAR | 1.30 | 0.87 | 0.91 |
|
| 178 |
+
| TransDiff-L MRAR | 1.30 | 0.925 | 0.95 |
|
| 179 |
| TransDiff-H MRAR | 1.28 | 0.87 | 0.91 |
|
| 180 |
| TransDiff-L 512x512 | 1.30 | 0.87 | 0.87 |
|
| 181 |
|