顾晓玲副教授

计算机学院（软件学院）

职务：

毕业院校：浙江大学

邮件： guxl@hdu.edu.cn

办公地点：

10 访问

个人简介

顾晓玲，杭州电子科技大学计算机学院副教授、博士生导师。2017年12月博士毕业于浙江大学，2018入职杭州电子科技大学。在2011年曾就职于阿里巴巴（中国）网络技术有限公司，担任软件开发工程师；在2016年至2017年期间在新加坡国立大学Mohan教授组进行访问学习。主要研究兴趣为计算机视觉与机器学习，涉及生成式人工智能、多模态图像生成、视频生成与编辑、以及时尚智能设计等课题。

以第一作者/通讯作者发表高质量论文30余篇（包括TMM、TCSTV、ACMM TOMM、ACM Multimedia、AAAI在内的 IEEE/ACM 、TOP期刊、 CCF A会共16篇）。在科研项目方面，申请人主持及参与国家级和省部级项目近10项，包括主持国家自然科学基金青年项目1项、面上项目1项，浙江省自然科学基金探索项目1项；参与国家自然科学基金国际（地区）合作与交流项目、国家自然科学基金重点项目、科技部国家重点研发计划等多项项目。

教育经历

(1) 2012-09 至 2017-12, 浙江大学, 计算机科学与技术, 博士. 导师：陈刚教授

(2) 2008-09 至 2011-03, 杭州电子科技大学, 计算机软件与理论, 硕士. 导师：王毅刚教授

(3) 2004-09 至 2008-06, 浙江财经大学, 计算机科学与技术, 学士

工作经历

(1) 2022-01 至今, 杭州电子科技大学, 计算机学院, 副教授

(2) 2018-09 至 2022-12, 杭州电子科技大学, 计算机学院, 副研究员

(3) 2018-01 至 2018-09, 杭州电子科技大学, 计算机学院, 讲师

(4) 2016-02 至 2017-06, 新加坡国立大学, 计算机学院, 访问学者

(5) 2011-03 至 2011-11, 阿里巴巴集团, 软件开发工程师, 无

社会职务

研究领域

主要包括生成式人工智能、多模态图像生成、视频生成以及时尚智能设计等。

教学与课程

[1] 主持2025年省级一流人工智能通识课程《AI实战：从零精通DeepSeek》。曾为浙江省人大、广东省人大、上海市人大、浙江省财政厅、浙江省机关事务管理局等多家机关单位及企业提供培训，累计培训学员超过1100人。

[2] 作为核心主讲老师，参与“2025年省级一流人工智能通识课程”名师名课《生成式人工智能应用基础》。

主讲研究生课程：

《人工智能工程实训》、《大模型理论与系统》、《论文写作指导》

主讲本科生课程：

《AI实战：从零到精通DeepSeek》、《C语言程序设计》、《Python程序语言设计》、《创新实践》

纵向科研

近五年主持或参加的国家自然科学基金项目/课题:

(1) 国家自然科学基金委员会, 面上项目, 精准可控的多模态交互式图像生成, 2025-01-01 至 2028-12-31, 49万元, 主持

(2) 国家自然科学基金委员会, 面上项目, 基于用户反馈特征预测的细粒度图像分类研究, 2020-01-01 至 2023-12-31, 60万元, 参与

(3) 国家自然科学基金委员会, 青年科学基金项目, 基于层次深度网络混合模型的图像识别技术研究, 2019-01-01 至 2021-12-31, 28万元, 参与

(4) 国家自然科学基金委员会, 青年科学基金项目, 基于多模态表征学习的时尚数据检索与推荐算法研究, 2019-01-01 至 2021-12-31, 27万元,主持

近五年主持或参加的其他科研项目/课题(国家自然科学基金项目除外):

(1) 浙江省自然科学基金委, 省自然科学基金/重点项目, 基于混合联邦学习的异构跨平台差异化推荐算法, 2023-01 至 2025-12, 30万元,参与

(2) 浙江省自然科学基金委, 省自然科学基金探索项目,面向多模态输入的服装智能生成算法研究, 2021-01 至 2023-12, 10万元, 主持

(3) 科技部, 国家重点研发, 基于新闻报道场景的AI辅助写稿机器人系统研发,806万元, 参与

(4) 科技部, 科技创新2030重大项目, 跨媒体因果推断理论与方法, 2019-12 至 2022- 12, 168万元, 参与

横向科研

《文生图基座模型高效训练和推理研究》，杭州任性智能科技有限公司，50万，杭州任性智能科技有限公司

论文

代表性期刊论文：

1. Xiaoling Gu, Lingwei Luo, Shengqi Wu, Zizhao Wu, Zhenzhong Kuang and Zhou Yu.

Compositional Text-to-Image Synthesis with Training-Free Layout-Guided Diffusion, TMM 2026 (CCF-A期刊)

2. Xiaoling Gu, Lingda Zhu, Yongkang Wong, Zhou Yu, Huan Li, Zizhao Wu, and Mohan S. Kankanhalli.

TailorEdit: An Adaptive Framework for Instruction-Guided Fashion Image Editing.

TCSVT 2026 (SCI一区Top期刊)

3. Zizhao Wu, Yingying Sun, Yiming Chen, Xiaoling Gu, Ruyu Liu, Jiazhou Chen: InterMamba:

Efficient Human-Human Interaction Generation With Adaptive Spatio-Temporal Mamba.

TVCG 2026 (CCF-A期刊)

4. Qida Cao, Jiajun Ding, Qingyuan Tang, Tianning Zhao, Xiaoling Gu, Jianping Fan, Zhou Yu:

GC-GS: Gradient control Gaussian splatting with various image degradation.

Pattern Recognit. 171: 112304 (2026)(SCI一区Top期刊)

5. Xinyuan Hu, Changyue Shi, Chuxiao Yang, Minghao Chen, Xiaoling Gu, Jiajun Ding, Jifa He,

Jianping Fan:Texture-aware 3D Gaussian Splatting for sparse view reconstructions.

Appl. Soft Comput. 182: 113530 (2025)(SCI一区Top期刊)

6. Shuo Yang, Xiaoling Gu, Zhenzhong Kuang, Feiwei Qin, Zizhao Wu:

Innovative AI techniques for photorealistic 3D clothed human reconstruction from monocular images or videos: a survey. Vis. Comput. 41(6): 3973-4000 (2025) （CCF C期刊，通讯作者）

7. Xiaoling Gu, Jie Huang, Yongkang Wong, Jun Yu, Jianping Fan, Pai Peng, Mohan S. Kankanhalli:

PAINT: Photo-realistic Fashion Design Synthesis.

ACM Trans. Multim. Comput. Commun. Appl. 20(2): 48:1-48:23 (2024) (CCF B期刊)

8. Kaixin Jin, Xiaoling Gu, Zimeng Wang, Zhenzhong Kuang, Zizhao Wu, Min Tan, Jun Yu:

Semantic-aware hyper-space deformable neural radiance fields for facial avatar reconstruction.

Pattern Recognit. Lett. 185: 160-166 (2024) （CCF C期刊，通讯作者）

9. Xiaoling Gu, Junkai Zhu, Yongkang Wong, Zizhao Wu, Jun Yu, Jianping Fan, Mohan S. Kankanhalli:

Recurrent Appearance Flow for Occlusion-Free Virtual Try-On.

ACM Trans. Multim. Comput. Commun. Appl. 20(8): 239:1-239:17 (2024) (CCF B期刊)

10. Xiaoling Gu, Shengwenzhuo Xu, Yongkang Wong, Zizhao Wu, Jun Yu, Jianping Fan, Mohan S. Kankanhalli:Multi2Human: Controllable human image generation with multimodal controls.

Neurocomputing 587: 127682 (2024) (SCI一区Top期刊)

11. Xiaoling Gu, Qiming Yao, Xiaojun Gong, Zhenzhong Kuang:iDesigner: making intelligent fashion designs.

Multim. Tools Appl. 83(11): 32835-32855 (2024) (CCF C期刊)

12. Min Tan, Tao Jin, Danhui Ye, Kuiwen Xu, Xiaoling Gu, Jun Yu:

Electromagnetic Imaging Boosted Visual Object Recognition Under Difficult Visual Conditions.

IEEE Trans. Geosci. Remote. Sens. 61: 1-12 (2023) (SCI一区Top期刊)

13. Min Tan, Fu Yuan, Jun Yu, Guijun Wang, Xiaoling Gu:

Fine-grained Image Classification via Multi-scale Selective Hierarchical Biquadratic Pooling.

ACM Trans. Multim. Comput. Commun. Appl. 18(1s): 31:1-31:23 (2022) (CCF B期刊)

14. Xiaoling Gu, Jun Yu, Yongkang Wong, Mohan S. Kankanhalli:

Toward Multi-Modal Conditioned Fashion Image Translation. IEEE Trans. Multim. 23: 2361-2371 (2021)

(CCF-A期刊)

15. Xiaoling Gu, Fei Gao, Min Tan, Pai Peng:

Fashion analysis and understanding with artificial intelligence. Inf. Process. Manag. 57(5): 102276 (2020)

(SCI一区Top期刊)

16. Xiaoling Gu, Yongkang Wong, Lidan Shou, Pai Peng, Gang Chen, Mohan S. Kankanhalli:

Multi-Modal and Multi-Domain Embedding Learning for Fashion Retrieval and Analysis.

IEEE Trans. Multim. 21(6): 1524-1537 (2019) (CCF-A期刊)

17. Xiaoling Gu, Sai Wu, Pai Peng, Lidan Shou, Ke Chen, Gang Chen:

CSIR4G: An effective and efficient cross-scenario image retrieval model for glasses.

Inf. Sci. 417: 310-327 (2017) (SCI一区Top期刊)

会议论文：

1. Xuehai Bai, Xiaoling Gu, Akide Liu, Hangjie Yuan, YiFan Zhang, Jack Ma：

MCIE: Multimodal LLM-Driven Complex Instruction Image Editing with Spatial Guidance.

AAAI 2026 (CCF-A会议，通讯作者)

2. Yichen Yan, Ming Zhong, Qi Zhu, Xiaoling Gu, Jinpeng Chen, Huan Li: CoIDO:

Efficient Data Selection for Visual Instruction Tuning via Coupled Importance-Diversity Optimization.

NeurIPS 2025 (CCF-A会议)

3. Zizhao Wu, Haohan Li, Gongyi Chen, Zhou Yu, Xiaoling Gu, Yigang Wang: 3D Question Answering with Scene Graph Reasoning. ACM Multimedia 2024: 1370-1378 （CCF-A会议，通讯作者）

4. Xiaoling Gu, Yongkang Wong, Pai Peng, Lidan Shou, Gang Chen, Mohan S. Kankanhalli:

Understanding Fashion Trends from Street Photos via Neighbor-Constrained Embedding Learning.

ACM Multimedia 2017: 190-198 (CCF A会议)

5. Xiaoling Gu, Lidan Shou, Pai Peng, Ke Chen, Sai Wu, Gang Chen:

iGlasses: A Novel Recommendation System for Best-fit Glasses.

SIGIR 2016: 1109-1112 (CCF A会议, Demo Paper)

科研成果

近五年主持或参加的国家自然科学基金项目/课题:

(1) 国家自然科学基金委员会, 面上项目, 精准可控的多模态交互式图像生成, 2025-01-01 至 2028-12-31, 49万元, 主持

(2) 国家自然科学基金委员会, 面上项目, 基于用户反馈特征预测的细粒度图像分类研究, 2020-01-01 至 2023-12-31, 60万元, 参与

(3) 国家自然科学基金委员会, 青年科学基金项目, 基于层次深度网络混合模型的图像识别技术研究, 2019-01-01 至 2021-12-31, 28万元, 参与

(4) 国家自然科学基金委员会, 青年科学基金项目, 基于多模态表征学习的时尚数据检索与推荐算法研究, 2019-01-01 至 2021-12-31, 27万元,主持

近五年主持或参加的其他科研项目/课题(国家自然科学基金项目除外):

(1) 浙江省自然科学基金委, 省自然科学基金/重点项目, 基于混合联邦学习的异构跨平台差异化推荐算法, 2023-01 至 2025-12, 30万元,参与

(2) 浙江省自然科学基金委, 省自然科学基金探索项目,面向多模态输入的服装智能生成算法研究, 2021-01 至 2023-12, 10万元, 主持

(3) 科技部, 国家重点研发, 基于新闻报道场景的AI辅助写稿机器人系统研发,806万元, 参与

(4) 科技部, 科技创新2030重大项目, 跨媒体因果推断理论与方法, 2019-12 至 2022- 12, 168万元, 参与

著作

专利成果

已授权专利：

(1) 一种指令驱动的个性化时尚图像编辑方法，ZL 2025 1 0211261.6，2025年02月25日

(2) 一种基于交叉注意力重分配的多实例可控图像生成方法，ZL 2024 1 0772782.4，2024年06月17日

(3) 一种基于高斯泼溅的说话人脸视频生成方法，ZL 2024 1 1575054.0，2024年11月06日

(4) 一种基于时序增强扩散模型的视频虚拟试衣方法，ZL 2024 1 1443269.7，2024年10月16日

(5) 基于多属性驱动的时尚图像个性化生成方法，ZL 2024 1 1788310.4，2025年03月14日

(6) 基于先验约束反演算法的图像编辑方法，ZL 2024 1 1586194.8，2025年02月07日

(7) 一种基于稠密流的虚拟试衣方法，ZL 2021 1 0686459.1，2024年07月02日

(8) 基于服装类别及纹理图案控制的时尚服装图像生成方法，ZL 2021 1 0535271.7，2024年02月02日

(9) 一种姿态和纹理引导的时尚服装设计合成方法，ZL202110660701, 2022年09月20日

荣誉及奖励

2026年，计算机学院优秀共产党员

2025年，计算机学院优秀共产党员

2024年，第27届全国计算机辅助设计与图形学学术会议最佳论文奖

2023年，计算机学院优秀共产党员

2023年，2023届毕业设计（论文）优秀指导教师

2020年，杭州电子科技大学班主任班课大赛三等奖

2020年，优秀班主任

2019年，计算机学院年度“科研工作先进个人”

软件成果

教职工个人主页

顾晓玲 副教授

顾晓玲副教授