头像

顾晓玲 副教授

计算机学院(软件学院)

职务:

毕业院校: 浙江大学
邮件: guxl@hdu.edu.cn
办公地点:

10 访问

个人简介

      顾晓玲,杭州电子科技大学计算机学院副教授、博士生导师。201712月博士毕业于浙江大学,2018入职杭州电子科技大学。在2011年曾就职于阿里巴巴(中国)网络技术有限公司,担任软件开发工程师;在2016年至2017年期间在新加坡国立大学Mohan教授组进行访问学习。主要研究兴趣为计算机视觉与机器学习,涉及生成式人工智能、多模态图像生成、视频生成与编辑、以及时尚智能设计等课题。

以第一作者/通讯作者发表高质量论文30余篇(包括TMM、TCSTV、ACMM TOMM、ACM Multimedia、AAAI在内的 IEEE/ACM 、TOP期刊、 CCF A会共16篇)。在科研项目方面,申请人主持及参与国家级和省部级项目近10项,包括主持国家自然科学基金青年项目1项、面上项目1项,浙江省自然科学基金探索项目1项;参与国家自然科学基金国际(地区)合作与交流项目、国家自然科学基金重点项目、科技部国家重点研发计划等多项项目。


教育经历

(1) 2012-09 至 2017-12, 浙江大学, 计算机科学与技术, 博士. 导师:陈刚教授

(2) 2008-09 至 2011-03, 杭州电子科技大学, 计算机软件与理论, 硕士. 导师:王毅刚教授

(3) 2004-09 至 2008-06, 浙江财经大学, 计算机科学与技术, 学士 


工作经历

(1) 2022-01 至今, 杭州电子科技大学, 计算机学院, 副教授

(2) 2018-09 至 2022-12, 杭州电子科技大学, 计算机学院, 副研究员 

(3) 2018-01 至 2018-09, 杭州电子科技大学, 计算机学院, 讲师

(4) 2016-02 至 2017-06, 新加坡国立大学, 计算机学院, 访问学者

(5) 2011-03 至 2011-11, 阿里巴巴集团, 软件开发工程师, 无 

社会职务
研究领域

主要包括生成式人工智能、多模态图像生成、视频生成以及时尚智能设计等。

教学与课程

[1] 主持2025年省级一流人工智能通识课程《AI实战:从零精通DeepSeek》。曾为浙江省人大、广东省人大、上海市人大、浙江省财政厅、浙江省机关事务管理局等多家机关单位及企业提供培训,累计培训学员超过1100人。

[2] 作为核心主讲老师,参与“2025年省级一流人工智能通识课程”名师名课《生成式人工智能应用基础》。


主讲研究生课程:

《人工智能工程实训》、《大模型理论与系统》、《论文写作指导》


     主讲本科生课程:

《AI实战:从零到精通DeepSeek》、《C语言程序设计》、《Python程序语言设计》、《创新实践》

纵向科研

近五年主持或参加的国家自然科学基金项目/课题:

(1) 国家自然科学基金委员会, 面上项目, 精准可控的多模态交互式图像生成, 2025-01-01 至 2028-12-31, 49万元, 主持

(2) 国家自然科学基金委员会, 面上项目,  基于用户反馈特征预测的细粒度图像分类研究, 2020-01-01 至 2023-12-31, 60万元, 参与

(3) 国家自然科学基金委员会, 青年科学基金项目, 基于层次深度网络混合模型的图像识别技术研究, 2019-01-01 至 2021-12-31, 28万元, 参与

(4) 国家自然科学基金委员会, 青年科学基金项目, 基于多模态表征学习的时尚数据检索与推荐算法研究, 2019-01-01 至 2021-12-31, 27万元,主持


近五年主持或参加的其他科研项目/课题(国家自然科学基金项目除外):

(1) 浙江省自然科学基金委, 省自然科学基金/重点项目, 基于混合联邦学习的异构跨平台差异化推荐算法, 2023-01 至 2025-12, 30万元,参与

(2) 浙江省自然科学基金委, 省自然科学基金探索项目,面向多模态输入的服装智能生成算法研究, 2021-01 至 2023-12, 10万元, 主持

(3) 科技部, 国家重点研发, 基于新闻报道场景的AI辅助写稿机器人系统研发,806万元, 参与

(4) 科技部, 科技创新2030重大项目, 跨媒体因果推断理论与方法, 2019-12 至 2022- 12, 168万元, 参与 


横向科研

文生图基座模型高效训练和推理研究》,杭州任性智能科技有限公司,50万,杭州任性智能科技有限公司

论文

代表性期刊论文:

1. Xiaoling Gu, Lingwei Luo, Shengqi Wu, Zizhao Wu, Zhenzhong Kuang and Zhou Yu.

Compositional Text-to-Image Synthesis with Training-Free Layout-Guided Diffusion, TMM 2026 (CCF-A期刊)


2. Xiaoling Gu, Lingda Zhu, Yongkang Wong, Zhou Yu, Huan Li, Zizhao Wu, and Mohan S. Kankanhalli.

TailorEdit: An Adaptive Framework for Instruction-Guided Fashion Image Editing.

TCSVT 2026 (SCI一区Top期刊)


3. Zizhao Wu, Yingying Sun, Yiming Chen, Xiaoling Gu, Ruyu Liu, Jiazhou Chen: InterMamba: 

Efficient Human-Human Interaction Generation With Adaptive Spatio-Temporal Mamba. 

TVCG 2026 (CCF-A期刊)


4. Qida Cao, Jiajun Ding, Qingyuan Tang, Tianning Zhao, Xiaoling Gu, Jianping Fan, Zhou Yu:

GC-GS: Gradient control Gaussian splatting with various image degradation.

Pattern Recognit. 171: 112304 (2026)(SCI一区Top期刊)


5. Xinyuan Hu, Changyue Shi, Chuxiao Yang, Minghao Chen, Xiaoling Gu, Jiajun Ding, Jifa He, 

Jianping Fan:Texture-aware 3D Gaussian Splatting for sparse view reconstructions.

 Appl. Soft Comput. 182: 113530 (2025)(SCI一区Top期刊)


6. Shuo Yang, Xiaoling Gu, Zhenzhong Kuang, Feiwei Qin, Zizhao Wu:

Innovative AI techniques for photorealistic 3D clothed human reconstruction from monocular images or videos: a survey. Vis. Comput. 41(6): 3973-4000 (2025) (CCF C期刊,通讯作者)


7. Xiaoling Gu, Jie Huang, Yongkang Wong, Jun Yu, Jianping Fan, Pai Peng, Mohan S. Kankanhalli: 

PAINT: Photo-realistic Fashion Design Synthesis.

ACM Trans. Multim. Comput. Commun. Appl. 20(2): 48:1-48:23 (2024) (CCF B期刊) 


8. Kaixin Jin, Xiaoling Gu, Zimeng Wang, Zhenzhong Kuang, Zizhao Wu, Min Tan, Jun Yu:

Semantic-aware hyper-space deformable neural radiance fields for facial avatar reconstruction. 

Pattern Recognit. Lett. 185: 160-166 (2024) (CCF C期刊,通讯作者


9. Xiaoling Gu, Junkai Zhu, Yongkang Wong, Zizhao Wu, Jun Yu, Jianping Fan, Mohan S. Kankanhalli:

Recurrent Appearance Flow for Occlusion-Free Virtual Try-On. 

ACM Trans. Multim. Comput. Commun. Appl. 20(8): 239:1-239:17 (2024) (CCF B期刊) 


10. Xiaoling Gu, Shengwenzhuo Xu, Yongkang Wong, Zizhao Wu, Jun Yu, Jianping Fan, Mohan S. Kankanhalli:Multi2Human: Controllable human image generation with multimodal controls. 

Neurocomputing 587: 127682 (2024) (SCI一区Top期刊) 


11. Xiaoling Gu, Qiming Yao, Xiaojun Gong, Zhenzhong Kuang:iDesigner: making intelligent fashion designs. 

Multim. Tools Appl. 83(11): 32835-32855 (2024) (CCF C期刊)


12. Min Tan, Tao Jin, Danhui Ye, Kuiwen Xu, Xiaoling Gu, Jun Yu:

Electromagnetic Imaging Boosted Visual Object Recognition Under Difficult Visual Conditions.

IEEE Trans. Geosci. Remote. Sens. 61: 1-12 (2023) (SCI一区Top期刊)


13. Min Tan, Fu Yuan, Jun Yu, Guijun Wang, Xiaoling Gu:

Fine-grained Image Classification via Multi-scale Selective Hierarchical Biquadratic Pooling.

 ACM Trans. Multim. Comput. Commun. Appl. 18(1s): 31:1-31:23 (2022) (CCF B期刊)


14. Xiaoling Gu, Jun Yu, Yongkang Wong, Mohan S. Kankanhalli:

Toward Multi-Modal Conditioned Fashion Image Translation. IEEE Trans. Multim. 23: 2361-2371 (2021)

 (CCF-A期刊) 


15. Xiaoling Gu, Fei Gao, Min Tan, Pai Peng: 

Fashion analysis and understanding with artificial intelligence. Inf. Process. Manag. 57(5): 102276 (2020)

 (SCI一区Top期刊) 


16. Xiaoling Gu, Yongkang Wong, Lidan Shou, Pai Peng, Gang Chen, Mohan S. Kankanhalli:

Multi-Modal and Multi-Domain Embedding Learning for Fashion Retrieval and Analysis. 

IEEE Trans. Multim. 21(6): 1524-1537 (2019)  (CCF-A期刊)


17. Xiaoling Gu, Sai Wu, Pai Peng, Lidan Shou, Ke Chen, Gang Chen:

CSIR4G: An effective and efficient cross-scenario image retrieval model for glasses.

Inf. Sci. 417: 310-327 (2017) (SCI一区Top期刊)


会议论文:

1. Xuehai BaiXiaoling GuAkide LiuHangjie YuanYiFan ZhangJack Ma:

MCIE: Multimodal LLM-Driven Complex Instruction Image Editing with Spatial Guidance.

AAAI 2026 (CCF-A会议,通讯作者)


2. Yichen Yan, Ming Zhong, Qi Zhu, Xiaoling Gu, Jinpeng Chen, Huan Li: CoIDO: 

Efficient Data Selection for Visual Instruction Tuning via Coupled Importance-Diversity Optimization.

NeurIPS 2025 (CCF-A会议)


3Zizhao Wu, Haohan Li, Gongyi Chen, Zhou Yu, Xiaoling Gu, Yigang Wang: 3D Question Answering with Scene Graph Reasoning. ACM Multimedia 2024: 1370-1378 (CCF-A会议,通讯作者)


4Xiaoling Gu, Yongkang Wong, Pai Peng, Lidan Shou, Gang Chen, Mohan S. Kankanhalli: 

Understanding Fashion Trends from Street Photos via Neighbor-Constrained Embedding Learning. 

ACM Multimedia 2017: 190-198 (CCF A会议)


5. Xiaoling Gu, Lidan Shou, Pai Peng, Ke Chen, Sai Wu, Gang Chen:

iGlasses: A Novel Recommendation System for Best-fit Glasses. 

SIGIR 2016: 1109-1112 (CCF A会议, Demo Paper)


科研成果

近五年主持或参加的国家自然科学基金项目/课题:

(1) 国家自然科学基金委员会, 面上项目, 精准可控的多模态交互式图像生成, 2025-01-01 至 2028-12-31, 49万元, 主持

(2) 国家自然科学基金委员会, 面上项目,  基于用户反馈特征预测的细粒度图像分类研究, 2020-01-01 至 2023-12-31, 60万元, 参与

(3) 国家自然科学基金委员会, 青年科学基金项目, 基于层次深度网络混合模型的图像识别技术研究, 2019-01-01 至 2021-12-31, 28万元, 参与

(4) 国家自然科学基金委员会, 青年科学基金项目, 基于多模态表征学习的时尚数据检索与推荐算法研究, 2019-01-01 至 2021-12-31, 27万元,主持


近五年主持或参加的其他科研项目/课题(国家自然科学基金项目除外):

(1) 浙江省自然科学基金委, 省自然科学基金/重点项目, 基于混合联邦学习的异构跨平台差异化推荐算法, 2023-01 至 2025-12, 30万元,参与

(2) 浙江省自然科学基金委, 省自然科学基金探索项目,面向多模态输入的服装智能生成算法研究, 2021-01 至 2023-12, 10万元, 主持

(3) 科技部, 国家重点研发, 基于新闻报道场景的AI辅助写稿机器人系统研发,806万元, 参与

(4) 科技部, 科技创新2030重大项目, 跨媒体因果推断理论与方法, 2019-12 至 2022- 12, 168万元, 参与 


著作
专利成果

已授权专利

(1)  一种指令驱动的个性化时尚图像编辑方法,ZL 2025 1 0211261.6,2025年02月25日 

(2) 一种基于交叉注意力重分配的多实例可控图像生成方法,ZL 2024 1 0772782.4,2024年06月17日 

(3) 一种基于高斯泼溅的说话人脸视频生成方法,ZL 2024 1 1575054.0,2024年11月06日

(4) 一种基于时序增强扩散模型的视频虚拟试衣方法,ZL 2024 1 1443269.7,2024年10月16日 

(5) 基于多属性驱动的时尚图像个性化生成方法,ZL 2024 1 1788310.4,2025年03月14日

(6) 基于先验约束反演算法的图像编辑方法,ZL 2024 1 1586194.8,2025年02月07日

(7) 一种基于稠密流的虚拟试衣方法,ZL 2021 1 0686459.1,2024年07月02日

(8) 基于服装类别及纹理图案控制的时尚服装图像生成方法,ZL 2021 1 0535271.7,2024年02月02日

(9)  一种姿态和纹理引导的时尚服装设计合成方法,ZL202110660701, 2022年09月20日






荣誉及奖励

2026年计算机学院优秀共产党员

2025年,计算机学院优秀共产党员

2024年,第27届全国计算机辅助设计与图形学学术会议最佳论文奖

2023年,计算机学院优秀共产党员

2023年,2023届毕业设计(论文)优秀指导教师

2020年,杭州电子科技大学班主任班课大赛三等奖

2020年,优秀班主任

2019年,计算机学院年度“科研工作先进个人”


软件成果