Jinbin Bai's picture

In a Training Loop 🔄

Jinbin Bai

BryanW

·

https://noyii.github.io/

AI & ML interests

Controllable Content Creation

Recent Activity

upvoted a paper 2 days ago

dMLLM-TTS: Self-Verified and Efficient Test-Time Scaling for Diffusion Multi-Modal Large Language Models

updated a model 6 days ago

BryanW/43c

published a model 6 days ago

BryanW/43c

View all activity

Organizations

upvoted a paper 2 days ago

dMLLM-TTS: Self-Verified and Efficient Test-Time Scaling for Diffusion Multi-Modal Large Language Models

Paper • 2512.19433 • Published 3 days ago • 3

upvoted a paper 9 days ago

RecTok: Reconstruction Distillation along Rectified Flow

Paper • 2512.13421 • Published 10 days ago • 4

upvoted 2 papers 2 months ago

From Masks to Worlds: A Hitchhiker's Guide to World Models

Paper • 2510.20668 • Published Oct 23 • 7

Lumina-DiMOO: An Omni Diffusion Large Language Model for Multi-Modal Generation and Understanding

Paper • 2510.06308 • Published Oct 7 • 54

upvoted a paper 5 months ago

Personalized Safety Alignment for Text-to-Image Diffusion Models

Paper • 2508.01151 • Published Aug 2 • 8

upvoted a paper 6 months ago

JarvisArt: Liberating Human Artistic Creativity via an Intelligent Photo Retouching Agent

Paper • 2506.17612 • Published Jun 21 • 64

upvoted a paper 7 months ago

Muddit: Liberating Generation Beyond Text-to-Image with a Unified Discrete Diffusion Model

Paper • 2505.23606 • Published May 29 • 14

upvoted a paper 9 months ago

An Empirical Study of GPT-4o Image Generation Capabilities

Paper • 2504.05979 • Published Apr 8 • 64

upvoted a paper 10 months ago

MagicInfinite: Generating Infinite Talking Videos with Your Words and Voice

Paper • 2503.05978 • Published Mar 7 • 36

upvoted 5 papers about 1 year ago

DiffSensei: Bridging Multi-Modal LLMs and Diffusion Models for Customized Manga Generation

Paper • 2412.07589 • Published Dec 10, 2024 • 48

HumanEdit: A High-Quality Human-Rewarded Dataset for Instruction-based Image Editing

Paper • 2412.04280 • Published Dec 5, 2024 • 14

MagicTailor: Component-Controllable Personalization in Text-to-Image Diffusion Models

Paper • 2410.13370 • Published Oct 17, 2024 • 37

Meissonic: Revitalizing Masked Generative Transformers for Efficient High-Resolution Text-to-Image Synthesis

Paper • 2410.08261 • Published Oct 10, 2024 • 52

Integrating View Conditions for Image Synthesis

Paper • 2310.16002 • Published Oct 24, 2023 • 3