ZHANG Yuechen

Representative Research Works

Training-Free Efficient Video Generation via Dynamic Token Carving

Yuechen Zhang, Jinbo Xing, Bin Xia, Shaoteng Liu, Bohao Peng, Xin Tao, Pengfei Wan, Eric Lo, Jiaya Jia

Preprint, 2025

Jenga accelerates HunyuanVideo by 4.68-10.35× through dynamic attention carving and progressive resolution generation.

arXiv Project Page Code

MagicMirror: ID-Preserved Video Generation in Video Diffusion Transformers

Yuechen Zhang*, Yaoyang Liu*, Bin Xia, Bohao Peng, Zexin Yan, Eric Lo, Jiaya Jia

Preprint, 2025

MagicMirror generates identity-preserved videos from reference images using a conditional adaptive normalization module.

arXiv Project Code

Mini-Gemini: Mining the Potential of Multi-modality Vision Language Models

Yanwei Li*, Yuechen Zhang*, Chengyao Wang*, Zhisheng Zhong, Yixin Chen, Ruihang Chu, Shaoteng Liu, Jiaya Jia

Preprint, 2024

Mini-Gemini is a novel framework ranges from 2B to 34B VLMs for hi-resolution image understanding.

arXiv Project Code

Prompt Highlighter: Interactive Control for Multi-Modal LLMs

Yuechen Zhang, Shengju Qian, Bohao Peng, Shu Liu, Jiaya Jia

CVPR, 2024

Prompt Highlighter is a training-free inference pipeline, which facilitates token-level user interactions for customized generation.

arXiv Project Code

Real-World Image Variation by Aligning Diffusion Inversion Chain

Yuechen Zhang, Jinbo Xing, Eric Lo, Jiaya Jia

NeurIPS (Spotlight), 2023

Given an image as the prompt, we can generate its variations by aligning the diffusion inversion chain. The variations are diverse and controllable.

arXiv Project Code

Ref-NPR: Reference-Based Non-Photorealistic Radiance Fields

Yuechen Zhang, Zexin He, Jinbo Xing, Xufeng Yao, Jiaya Jia

CVPR, 2023

We present a controllable scene stylization method utilizing radiance fields to stylize a 3D scene, with a single stylized 2D view taken as reference.

arXiv Project Code

Full Publications

Training-Free Efficient Video Generation via Dynamic Token Carving

Yuechen Zhang, Jinbo Xing, Bin Xia, Shaoteng Liu, Bohao Peng, Xin Tao, Pengfei Wan, Eric Lo, Jiaya Jia

Preprint, 2024

arXiv / Project / Code

MagicMirror: ID-Preserved Video Generation in Video Diffusion Transformers

Yuechen Zhang*, Yaoyang Liu*, Bin Xia, Bohao Peng, Zexin Yan, Eric Lo, Jiaya Jia

Preprint, 2025

arXiv / Project / Code

Mini-Gemini: Mining the Potential of Multi-modality Vision Language Models

Yanwei Li*, Yuechen Zhang*, Chengyao Wang*, Zhisheng Zhong, Yixin Chen, Ruihang Chu, Shaoteng Liu, Jiaya Jia

Preprint, 2024

arXiv / Project / Code

Prompt Highlighter: Interactive Control for Multi-Modal LLMs

Yuechen Zhang, Shengju Qian, Bohao Peng, Shu Liu, Jiaya Jia

CVPR, 2024

arXiv / Project / Code

Real-World Image Variation by Aligning Diffusion Inversion Chain

Yuechen Zhang, Jinbo Xing, Eric Lo, Jiaya Jia

NeurIPS (Spotlight), 2023

arXiv / Project / Code

Ref-NPR: Reference-Based Non-Photorealistic Radiance Fields

Yuechen Zhang, Zexin He, Jinbo Xing, Xufeng Yao, Jiaya Jia

CVPR, 2023

arXiv / Project / Code

Video-P2P: Video Editing with Cross-attention Control

Shaoteng Liu, Yuechen Zhang, Wenbo Li, Zhe Lin, Jiaya Jia

CVPR, 2024

arXiv / Project / Code

DreamOmni: Unified Image Generation and Editing

Bin Xia, Yuechen Zhang, Jingyao Li, Chengyao Wang, Yitong Wang, Xinglong Wu, Bei Yu, Jiaya Jia

CVPR, 2025

arXiv / Project / Code

ControlNeXt: Powerful and Efficient Control for Image and Video Generation

Bohao Peng, Jian Wang, Yuechen Zhang, Wenbo Li, Ming-Chang Yang, Jiaya Jia

Preprint, 2024

arXiv / Project / Demo / Code

R²Former: Probing Region Relationship in Semantic Segmentation Transformers

Yuechen Zhang, Tiancheng Shen*, Huaijia Lin, Lu Qi, Eric Lo, Jiaya Jia

Preprint, 2022

High Quality Segmentation for Ultra High-resolution Images

Tiancheng Shen, Yuechen Zhang, Lu Qi, Jason Kuen, Xingyu Xie, Jianlong Wu, Zhe Lin, Jiaya Jia

CVPR, 2022

Paper / Code

ResMaster: Mastering High-Resolution Image Generation via Structural and Fine-Grained Guidance

Shuwei Shi, Wenbo Li, Yuechen Zhang, Jingwen He, Biao Gong, Yinqiang Zheng

AAAI, 2025

arXiv

Make-Your-Video: Customized Video Generation Using Textual and Structural Guidance

Jinbo Xing, Menghan Xia, Yuxin Liu, Yuechen Zhang, Yong Zhang, Yingqing He, Hanyuan Liu, Haoxin Chen, Xiaodong Cun, Xintao Wang, Ying Shan, Tien-Tsin Wong

TVCG, 2025

Paper / arXiv / Project / Code

Customized video generation using textual and structural guidance.

CodeTalker: Speech-Driven 3D Facial Animation with Discrete Motion Prior

Jinbo Xing, Menghan Xia, Yuechen Zhang, Xiaodong Cun, Jue Wang, Tien-Tsin Wong

CVPR, 2023

arXiv / Project / Code

Progressively Knowledge Distillation via Re-parameterizing Diffusion Reverse Process

Xufeng Yao, Fanbin Lu, Yuechen Zhang, Xinyun Zhang, Wenqian Zhao, Bei Yu

AAAI, 2024

Paper

PCL: Proxy-based Contrastive Learning for Domain Generalization

Xufeng Yao, Yang Bai, Xinyun Zhang, Yuechen Zhang, Qi Sun, Ran Chen, Ruiyu Li, Bei Yu

CVPR, 2022

Paper / Code

Flow-aware Synthesis: A Generic Motion Model for Video Frame Interpolation

Jinbo Xing*, Wenbo Hu*, Yuechen Zhang, Tien-Tsin Wong

Computational Visual Media (CVM), 2021

Paper

Education & Work Experience

The Chinese University of Hong Kong Hong Kong

Doctor of Philosophy, Computer Science. Aug 2021 - Dec 2025 (expected)

Supervisor: Prof. Jia Jiaya, Prof. Eric Lo

Bachelor of Computer Science Sep 2016 - Jul 2021

First Class Honour, ELITE Stream

Nanyang Technological University Singapore

[Exchange] GEM Trailblazer Exchange Program Jan 2019 - May 2019

Tsinghua University Beijing, China

[Exchange] Yao Class Summer Program Jul 2019 - Aug 2019

Kling, Kuaishou Shenzhen, China

Research Internship Feb 2025 - June 2025

Research on efficient video generation.

LightSpeed, Tencent Hong Kong

Research Internship Feb 2024 - Jul 2024

Research on interactive video generation and customization.

SmartMore Hong Kong

Work Study Internship Jan 2020 - Jul 2025

Research on image segmentation on real-world industry projects, including defect detection and chip circuit high-precision instance segmentation. Developing an algorithm for 2D Datamatrix code recognition and decoding.

ZHANG Yuechen, Julian

Representative Research Works

Full Publications

Education & Work Experience

Awards & Community Contributions