About | Infinite Script

Haozhe Xie (谢浩哲)

Research Fellow at MMLab@NTU

College of Computing and Data Science
Nanyang Technological University

Emails:

General Inquiries: root [at] haozhexie [dot] com
Academic Matters: academic [at] haozhexie [dot] com

GitHub / Twitter / Google Scholar / Curriculum Vitae

Biography

I am currently working as a research fellow at MMLab@NTU, Nanyang Technological University, under the supervision of Prof. Ziwei Liu. Prior to this, I served as a senior research scientist (2021-2023) at Tencent AI Lab.
I completed my Ph.D. degree (2017-2021) at the VILab of Harbin Institute of Technology, under the guidance of Prof. Hongxun Yao. During my Ph.D. study, I interned at SenseTime Research.
My research interests include 3D vision and robotics with a focus on 3D generation and perception.

Selected Publications

3D Scene Generation: A Survey

Beichen Wen*
Haozhe Xie*
Zhaoxi Chen
Fangzhou Hong
Ziwei Liu

arXiv 2505.05474

Compositional Generative Model of Unbounded 4D Cities

Haozhe Xie
Zhaoxi Chen
Fangzhou Hong
Ziwei Liu

arXiv 2501.08983

Generative Gaussian Splatting for Unbounded 3D City Generation

Haozhe Xie
Zhaoxi Chen
Fangzhou Hong
Ziwei Liu

CVPR 2025

3DTopia-XL: Scaling High-quality 3D Asset Generation via Primitive Diffusion

Zhaoxi Chen
Jiaxiang Tang
Yuhao Dong
Ziang Cao
Fangzhou Hong
Yushi Lan
Tengfei Wang
Haozhe Xie
Tong Wu
Shunsuke Saito
Liang Pan
Dahua Lin
Ziwei Liu

CVPR 2025

DynamicCity: Large-Scale 4D Occupancy Generation from Dynamic Scenes

Hengwei Bian
Lingdong Kong
Haozhe Xie
Liang Pan
Yu Qiao
Ziwei Liu

ICLR 2025

2D Semantic-Guided Semantic Scene Completion

Xianzhu Liu
Haozhe Xie
Shengping Zhang
Hongxun Yao
Rongrong Ji
Liqiang Nie
Dacheng Tao

International Journal of Computer Vision (IJCV), 133, 1306-1325, 2025

CrowdMoGen: Zero-Shot Text-Driven Collective Motion Generation

Yukang Cao*
Xinying Guo*
Mingyuan Zhang
Haozhe Xie
Chenyang Gu
Ziwei Liu

arXiv 2407.06188

CityDreamer: Compositional Generative Model of Unbounded 3D Cities

Haozhe Xie
Zhaoxi Chen
Fangzhou Hong
Ziwei Liu

CVPR 2024

Blur-aware Spatio-temporal Sparse Transformer for Video Deblurring

Huicong Zhang
Haozhe Xie
Hongxun Yao

CVPR 2024

Learning Geometric Transformation for Point Cloud Completion

Shengping Zhang
Xianzhu Liu
Haozhe Xie
Liqiang Nie
Huiyu Zhou
Dacheng Tao
Xuelong Li

International Journal of Computer Vision (IJCV), 131, 2425–2445, 2023

Spatio-Temporal Deformable Attention Network for Video Deblurring

Huicong Zhang
Haozhe Xie
Hongxun Yao

ECCV 2022

Long-Range Feature Propagating for Natural Image Matting

Qinglin Liu
Haozhe Xie
Shengping Zhang
Bineng Zhong
Rongrong Ji

ACM Multimedia 2021

3D Scene and Object Reconstruction from Multiple Sources and Viewpoints

Haozhe Xie

PhD Thesis, Harbin Institute of Technology, 2021

Efficient Regional Memory Network for Video Object Segmentation

Haozhe Xie
Hongxun Yao
Shangchen Zhou
Shengping Zhang
Wenxiu Sun

CVPR 2021

GRNet: Gridding Residual Network for Dense Point Cloud Completion

Haozhe Xie
Hongxun Yao
Shangchen Zhou
Jiageng Mao
Shengping Zhang
Wenxiu Sun

ECCV 2020

Pix2Vox++: Multi-scale Context-aware 3D Object Reconstruction from Single and Multiple Images

Haozhe Xie
Hongxun Yao
Shengping Zhang
Shangchen Zhou
Wenxiu Sun

International Journal of Computer Vision (IJCV), 128(12): 2919-2935, 2020

Pix2Vox: Context-aware 3D Reconstruction from Single and Multi-view Images

Haozhe Xie
Hongxun Yao
Xiaoshuai Sun
Shangchen Zhou
Shengping Zhang

ICCV 2019

Spatio-Temporal Filter Adaptive Network for Video Deblurring

Shangchen Zhou
Jiawei Zhang
Jinshan Pan
Haozhe Xie
Wangmeng Zuo
Jimmy Ren

ICCV 2019

DAVANet: Stereo Deblurring with View Aggregation

Shangchen Zhou
Jiawei Zhang
Wangmeng Zuo
Haozhe Xie
Jinshan Pan
Jimmy Ren

CVPR 2019

Research Experience

Research Fellow
Mar 2023 - Present | MMLab@NTU, Nanyang Technological University
Working with Prof. Ziwei Liu.

NTU

Senior Research Scientist
Aug 2021 - Mar 2023 | Tencent AI Lab
Working with Dr. Hong Shang. Outstanding Contibutor (2022H1) & Excellent Individual (2022H2)

TecentAILab

Research Intern
Mar 2019 - Nov 2020 | SenseTime Research
Mentored by Dr. Wenxiu Sun. Outstanding Intern (2020H2)

SenseTime

Invited Talks

From Multimodal Generative Models to Dynamic World Modeling. VALSE 2025, Zhuhai, China. June 2025.
Toward World Models: From 3D to 4D City Generation. 3D Computer Vision (3D 视觉工坊), Online. March 2025. [Video playback]
3D Object and Scene Reconstruction Meets Neural Networks. Faculty of Computing, Harbin Institute of Technology, Harbin, China. May 2022. [News]
Deep Learning Fundamentals. Zhejiang Institute of Research and Innovation, The University of Hong Kong, Hangzhou, China. July 2019. [News]
Computer Fundamentals. Hangzhou No.14 High School, Hangzhou, China. August 2014.
Data Structure. Hangzhou No.14 High School, Hangzhou, China. August 2012.

Academic Services

Co-organizer: CVPR'25 Tutorial: From Video Generation to World Model
Conference Reviewer: CVPR, ICCV, ECCV, ICML, ICLR, NeurIPS, SIGGRAPH Asia, AAAI, Eurographics, 3DV, WACV, ACM Multimedia
Journal Reviewer: TPAMI, TIP, TMM, IJCV, PR

Teaching

NTU AI6126: Advanced Computer Vision, Teaching Assistant, Spring 2025.
HIT CS32261: Audio-Visual Signal Processing, Teaching Assistant, Fall 2018.