合肥工业大学主页平台管理系统 Dan Guo--Home--Scientific Research

Personal Information

Professor
Supervisor of Doctorate Candidates
Supervisor of Master's Candidates

School/Department:Lab for Multimedia Computing, School of Computer Sci & Information Engineering, School of Artificial Intelligence Hefei University of Technology (HFUT)

Administrative Position:Professor

Education Level:Postgraduate (Doctoral)

Business Address:Kejiao A Building, Feicui Campus of HFUT, Hefei, Anhui, China

Gender:Female

Degree:Doctoral degree

Status:Employed

Alma Mater:Huazhong University of Science and Technology

Hefei University of Technology

Dan Guo

Gender:Female

Education Level:Postgraduate (Doctoral)

Alma Mater:Huazhong University of Science and Technology

Scientific Research

Current position: Home / Scientific Research

Research Field

The main research directions are machine vision, machine learning, deep learning, pattern recognition.

· Cross-modal Understanding and Reasoning

· Audio-Visual Event Understanding and Parsing

· Image/Video Captioning and Explanation

· Temporal Action Detection / Video Grounding

· Vison-based Sign Language Recognition and Translation）

· Vision-based Physiological Measurement

Characteristic research

· Visual Affective Computing

· Visual Sign Language Machine Translation

· Video Semantic Analysis and Grounding

· Visual Chatbot

Paper Publications

The following is a partial list of papers: (mainly CCF-A conferences/journals, IEEE/ACM Transactions journals, etc.)

Highlights:

1. Dan Guo, Hui Wang, and Meng Wang*. "Context-Aware Graph Inference with Knowledge Distillation for Visual Dialog", IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI, Trans., IF 24.314 ), 2021.

2. Jinxing Zhou, Dan Guo* and Meng Wang*. "Contrastive Positive Sample Propagation along the Audio-Visual Event Line", IEEE Transactions on Pattern Analysis and Machine Intelligence(TPAMI, Trans., IF 24.314 ), 2022.

3. Chunxiao Fan, Dan Guo*, Ziqi Wang, Meng Wang. "Multi-Objective Convex Quantization for Efficient Model Compression", IEEE Transactions on Pattern Analysis and Machine Intelligence(TPAMI, Trans., IF 24.314 ), 2024

4. Jinxing Zhou, Dan Guo*, Yiran Zhong, Meng Wang*. "Advancing Weakly-Supervised Audio-Visual Video Parsing via Segment-wise Pseudo Labeling", International Journal of Computer Vision (IJCV), 2024.

5. Dan Guo, Kun Li*, Bin Hu, Yan Zhang, Meng Wang*. "Benchmarking Micro-action Recognition: Dataset, Methods, and Applications", IEEE Transactions on Circuits and Systems for Video Technology. (IEEE TCSVT, Trans.), 2024.

6. Dan Guo, Hui Wang*, Hanwang Zhang, Zhengjun Zha, and Meng Wang*. "Iterative Context-Aware Graph Inference for Visual Dialog", Conference on Computer Vision and Pattern Recognition (CVPR, oral paper, Top 5%), 2020.

7. Fei Wang, Dan Guo*, Kun Li, Zhun Zhong, Meng Wang*. "Frequency Decoupling for Motion Magnification via Multi-Level Isomorphic Architecture", Conference on Computer Vision and Pattern Recognition (CVPR), 2024.

2026

1. Zheng Zhang, Jiabao Guo, Fei Wang, Jinyang Huang, Zhi Liu*, Dan Guo*. "TG4MM: Time-Varying Gaussian Splatting for 3D Motion Magnification", IEEE Transactions on Circuits and Systems for Video Technology. (IEEE TCSVT, Trans.), 2026.

2. You Qin, Wei Ji*, Xinze Lan, Hao Fei, Xun Yang, Dan Guo, Lizi Liao. "Grounding is All You Need? Dual Temporal Grounding for Video Dialog", IEEE Transactions on Multimedia (IEEE TMM, Trans.), 2026.

3. Sheng Zhou, Junbin Xiao, Xun Yang*, Peipei Song , Dan Guo*, Angela Yao*, Meng Wang. "Scene-Text Grounding for Text-Based Video Question Answering ", IEEE Transactions on Multimedia (IEEE TMM, Trans.), 2026.

4. Kewei Wu, Chongjia Zhu, Zhao Xie*, Kun Shao, Dan Guo*. "Mask-aware Kernel Learning for Action Recognition", IEEE Transactions on Multimedia (IEEE TMM, Trans.), 2026.

5. Tianyu Chang, Peipei Song*, Xun Yang*, Dan Guo, Xiaojun Chang. "Aleatoric-Epistemic Joint Uncertainty Modeling for Cross-Modal Retrieval", IEEE Transactions on Cybernetics (TCYB, Trans.), 2026.

6. Sheng Sang, Shujie Li, Shuaiyang Li, Kang Liu, Teng Li, Wei Jia, Dan Guo, Feng Xue*. "Bidirectional Counterfactual Distillation for Review-Based Recommendation", AAAI Conference on Artificial Intelligence (AAAI), 2026.

7. Feng Xue, Baochao Zhu, Wei Jia, Shujie Li, Yu Li, Jinrui Zhang, Shengeng Tang, Dan Guo*. "LinProVSR: Linguistics-Knowledge Guided Progressive Disambiguation Network for Visual Speech Recognition", AAAI Conference on Artificial Intelligence (AAAI), 2026.

8. Jinpeng Hu, Ao Wang, Qianqian Xie, Zhuo Li, Hui Ma, Dan Guo*. "AgentMental: An Interactive Multi-Agent Framework for Explainable and Adaptive Mental Health Assessment", AAAI Conference on Artificial Intelligence (AAAI), 2026.

9. Xu Liu, Na Xia*, Jinxing Zhou, Jingyuan Xu, Dan Guo*.. "A Closer Look at Knowledge Distillation in Spiking Neural Network Training", AAAI Conference on Artificial Intelligence (AAAI), 2026.

10. Jinxing Zhou, Ziheng Zhou, Yanghao Morty Zhou, Yuxin Mao, Zhangling Duan, Dan Guo*. "CLASP: Cross-modal Salient Anchor-based Semantic Propagation for Weakly-supervised Dense Audio-Visual Event Localization", AAAI Conference on Artificial Intelligence (AAAI), 2026.

11. Yuyan Liu, Li Zhang, Di Wu, Yan Zhang, Anran Huang, Wangzhi, Liu Liu*, Dan Guo. "SIAM: Towards Generalizable Articulated Object Modeling via Single Robot-Object Interaction", AAAI Conference on Artificial Intelligence (AAAI), 2026.

2025

12. Kun Li, Dan Guo*, Guoliang Chen*, Chunxiao Fan, Jingyuan Xu, zhiliang wu, Hehe Fan, Meng Wang*. "Prototypical Calibrating Ambiguous Samples for Micro-Action Recognition"，AAAI Conference on Artificial Intelligence (AAAI), 2025.

13. Shengeng Tang, Jiayi He, Dan Guo, Yanyan Wei, Feng Li, Richang Hong. "Sign-IDD: Iconicity Disentangled Diffusion for Sign Language Production", AAAI Conference on Artificial Intelligence (AAAI), 2025.

14. Pengcheng Zhao, Jinxing Zhou, Dan Guo*, Yang Zhao, Yanxiang Chen*. "Multimodal Class-aware Semantic Enhancement Network for Audio-Visual Video Parsing", AAAI Conference on Artificial Intelligence (AAAI), 2025.

15. Ziheng Zhou, Jinxing Zhou, Wei Qian, Shengeng Tang, Xiaojun Chang, Dan Guo*. "Dense Audio-Visual Event Localization under Cross-Modal Consistency and Multi-Temporal Granularity Collaboration", AAAI Conference on Artificial Intelligence (AAAI), 2025.

16. Wei Qian, Gaoji Su, Dan Guo*, Jinxing Zhou, Xiaobai Li, Bin Hu, Shengeng Tang, Meng Wang*. "PhysDiff: Physiology-based Dynamicity Disentangled Diffusion Model for Remote Physiological Measurement", AAAI Conference on Artificial Intelligence (AAAI, oral, top 4.6%), 2025.

17. Jingjing Hu, Dan Guo*, Zhan Si, Deguang Liu, Yunfeng Diao, Jing Zhang, Jinxing Zhou, Meng Wang*. "MOL-Mamba: Enhancing Molecular Representation with Structural & Electronic Insights", AAAI Conference on Artificial Intelligence (AAAI), 2025.

18. Zhangbin Li, Jinxing Zhou, Jing Zhang, Shengeng Tang, Kun Li, Dan Guo*. "Patch-level Sounding Object Tracking for Audio-Visual Question Answering", AAAI Conference on Artificial Intelligence (AAAI), 2025.

19. Xinyi Wang, Na Zhao, Zhiyuan Han, Dan Guo, Xun Yang. "AugRefer: Advancing 3D Visual Grounding via Cross-Modal Augmentation and Spatial Relation-based Referring", AAAI Conference on Artificial Intelligence (AAAI), 2025.

20. Kun Li, Xinge Peng, Dan Guo*, Xun Yang, Meng Wang*. "Repetitive Action Counting with Hybrid Temporal Relation Modeling", IEEE Transactions on Multimedia (IEEE TMM, Trans.), 2025.

21. Zhenqiang Zhang, Kun Li, Shengeng Tang, Yanyan Wei, Fei Wang, Jinxing Zhou, Dan Guo*. "Temporal Boundary Awareness Network for Repetitive Action Counting", ACM Transactions on Multimedia Computing, Communications and Applications (ACM TOMCCAP , Trans.), 2025.

22. Zhao Xie, Longsheng Lu, Kewei Wu, Zhehan Kan, Xingming Yang, Dan Guo*. "Instructive Probabilistic Transformer for Complex Action Recognition", IEEE Transactions on Multimedia (IEEE TMM, Trans.), 2025.

23. Xinke Wang, Jingyuan Xu, Xiao Sun*, Mingzheng Li, Bin Hu, Wei Qian, Dan Guo*, Meng Wang*. "Facial Depression Estimation via Multi-Cue Contrastive Learning", IEEE Transactions on Circuits and Systems for Video Technology. (IEEE TCSVT, Trans.), 2025.

24. Peipei Song, Long Zhang, Long Lan, Weidong Chen, Dan Guo, Xun Yang*, and Meng Wang. "Towards Efficient Partially Relevant Video Retrieval with Active Moment Discovering", IEEE Transactions on Multimedia (IEEE TMM, Trans.), 2025.

25. Xu Liu, Na Xia*, Jinxing Zhou, Zhangbin Li, Dan Guo*. "Towards Energy-efficient Audio-Visual Classification via Multimodal Interactive Spiking Network", ACM Transactions on Multimedia Computing, Communications and Applications (ACM TOMCCAP , Trans.), 2025.

26. Jingjing Hu，Dan Guo*，Kun Li, Zhan Si, Xun Yang, Xiaojun Chang, Meng Wang. "Unified Static and Dynamic Network: Efficient Temporal Filtering Video Grounding", IEEE Transactions on Pattern Analysis and Machine Intelligence(TPAMI, Trans. IF 24.314 ), 2025.

27. Yunfeng Diao, Kaichao Jiang, Dan Guo*, Zhenyu Liang*, Zenglin Shi, Zhenxing Qian, Meng Wang. "Post-train Black-box Defense via Energy-based Bayesian Adversarial Training",SCIENTIA SINICA Informationis(SSI), 2025.

28. Sheng Zhou, Junbin Xiao, Qingyun Li, Yicong Li, Xun Yang, Dan Guo, Meng Wang, Tat-Seng Chua, Angela Yao. "EgoTextVQA: Towards Egocentric Scene-Text Aware Video Question Answering", Conference on Computer Vision and Pattern Recognition (CVPR), 2025.

29. Shengeng Tang, Jiayi He, Lechao Cheng*, Jingjing Wu, Dan Guo, Richang Hong*. "Discrete to Continuous: Generating Smooth Transition Poses from Sign Language Observations", Conference on Computer Vision and Pattern Recognition (CVPR), 2025.

30. Zhenxing Zhang, Yaxiong Wang, Lechao Cheng, Zhun Zhong, Dan Guo, Meng Wang. "ASAP: Advancing Semantic Alignment Promotes Multi-Modal Manipulation Detecting and Grounding", Conference on Computer Vision and Pattern Recognition (CVPR), 2025.

31. Jinxing Zhou, Dan Guo*, Ruohao Guo, Yuxin Mao, Jingjing Hu, Yiran Zhong, Xiaojun Chang, Meng Wang*. "Towards Open-Vocabulary Audio-Visual Event Localization", Conference on Computer Vision and Pattern Recognition (CVPR), 2025.

32. Wan Jiang, He Wang, Xin Zhang, Dan Guo, Zhaoxin Fan, Yunfeng Diao*, Richang Hong. "Moderating the Generalization of Score-based Generative Model", International Conference on Computer Vision(ICCV), 2025.

33. Kun Li, Dan Guo*, Pengyu Liu, Guoliang Chen, Meng Wang*. "MMAD: Multi-label Micro-Action Detection in Videos", International Conference on Computer Vision(ICCV), 2025.

34. Jingjing Hu，Dan Guo，Meng Wang，Jiaxi Li, Liu Fei. "Reproducibility Companion Paper: Maskable Retentive Network for Video Moment Retrieval", ACM Mutilmedia (ACM MM), 2025.

35. Xueyu Yuan, Jiarui Zhang, Jiangqi Song, Liu Liu*, Li Zhang, Dan Guo, Richang Hong, Meng Wang. "DFGAP: Towards Depth-Free Cross-Category GAParts Perception via Uncertainty-Quantified Modeling", ACM Mutilmedia (ACM MM), 2025.

36. Feng-Qi Cui, Anyang Tong, Jinyang Huang*, Jie Zhang, Dan Guo, Zhi Liu, Meng Wang. "Learning from Heterogeneity: Generalizing Dynamic Facial Expression Recognition via Distributionally Robust Optimization", ACM Mutilmedia (ACM MM), 2025.

37. Ran Zhang, Xuanhua He, Ke Cao, Liu Liu*, Li Zhang, Man Zhou, Jie Zhang*, Dan Guo, Meng Wang. "Distilling Textual Priors from LLM to Efficient Image Fusion", IEEE Transactions on Circuits and Systems for Video Technology. (IEEE TCSVT, Trans.), 2025.

38. Yanan Zhu, Jiaqiu Ai*, Le Wu, Dan Guo, Wei Jia, Richang Hong. "An Active Multi-Target Domain Adaptation Strategy: Progressive Class Prototype Rectification", IEEE Transactions on Multimedia (IEEE TMM, Trans.), 2025.

39. Jing Zhang, Dan Guo*, Zhangbin Li, Meng Wang. "EmoSEM: Segment and Explain Emotion Stimuli in Visual Art", MMAsia, Best Student Paper, 2025.

40. Wei Qian、Gaoji Su、Kun Li*、Yuchen Ding、Xiangyuan Jia, Dan Guo*. "DiffRePSS: A Diffusion model for Remote Physiological Signal Sensing", IJCAI Challenge paper, 2025.

2024

41. Jinxing Zhou, Xuyang Shen, Jianyuan Wang, Jiayi Zhang, Weixuan Sun, Jing Zhang, Stan Birchfield, Dan Guo, Lingpeng Kong, Meng Wang* , Yiran Zhong*. “Audio-Visual Segmentation with Semantics”, International Journal of Computer Vision (IJCV), 2024.

42. Jinxing Zhou, Dan Guo*, Yiran Zhong, Meng Wang*. "Advancing Weakly-Supervised Audio-Visual Video Parsing via Segment-wise Pseudo Labeling", International Journal of Computer Vision (IJCV), 2024.

43. Shuaiyang Li, Feng Xue, Kang Liu, Dan Guo, Richang Hong. "Multimodal Graph Causal Embedding for Multimedia-based Recommendation", IEEE Transactions on Knowledge and Data Engineering (TKDE, Trans.)，2024.

44. Chunxiao Fan, Dan Guo*, Ziqi Wang, Meng Wang*. "Multi-Objective Convex Quantization for Efficient Model Compression", IEEE Transactions on Pattern Analysis and Machine Intelligence(TPAMI, Trans. IF 24.314 ), 2024.

45. Wei Qian, Kun Li, Dan Guo*, Bin Hu, Meng Wang*. "Cluster-Phys: Facial Clues Clustering Towards Efficient Remote Physiological Measurement", ACM Mutilmedia (ACM MM, Oral paper, top 3.97%), 2024.

46. Jingjing Hu, Dan Guo*, Kun Li, Zhan Si, Xun Yang*, Meng Wang*. "Maskable Retentive Network for Video Moment Retrieval", ACM Mutilmedia (ACM MM), 2024.

47. Xun Yang*, Jianming Zeng, Dan Guo, Shanshan Wang, Jianfeng Dong, Meng Wang. "Robust video question answering via contrastive cross-modality representation learning", Science China Information Sciences (SCIS ), 2024.

48. Jinpeng Hu, Tengteng Dong, Luo Gang, Hui Ma, Peng Zou, Xiao Sun, Dan Guo, Xun Yang, Meng Wang∗. "PsycoLLM: Enhancing LLM for Psychological Understanding and Evaluation", IEEE Transactions on Computational Social Systems (IEEE TCSS, Trans.), 2024.

49. Jinxing Zhou, Dan Guo*, Yuxin Mao, Yiran Zhong, Xiaojun Chang, Meng Wang. "Label-anticipated Event Disentanglement for Audio-Visual Video Parsing", European Conference on Computer Vision (ECCV), 2024.

50. Jing Zhang, Liang Zheng*, Meng Wang, Dan Guo*. "Training A Small Emotional Vision Language Model for Visual Art Comprehension", European Conference on Computer Vision (ECCV), 2024.

51. Fei Wang, Dan Guo*, Kun Li, Zhun Zhong, Meng Wang*. "Frequency Decoupling for Motion Magnification via Multi-Level Isomorphic Architecture", Conference on Computer Vision and Pattern Recognition (CVPR), 2024.

52. Chunxiao Fan, Ziqi Wang, Dan Guo*, Meng Wang. "Data-Free Quantization via Pseudo-label Filtering", Conference on Computer Vision and Pattern Recognition (CVPR), 2024.

53. Fei Wang, Dan Guo*, Kun Li, Meng Wang*. "EulerMormer: Robust Eulerian Motion Magnification via Dynamic Filtering within Transformer", AAAI Conference on Artificial Intelligence (AAAI), 2024.

54. Zhangbin Li, Dan Guo*, Jinxing Zhou*, Jing Zhang, Meng Wang. "Object-aware Adaptive-Positivity Learning for Audio-Visual Question Answering", AAAI Conference on Artificial Intelligence (AAAI), 2024.

55. Zhao Xie, Yadong Shi, Kewei Wu, Yaru Cheng, Dan Guo*. "Towards Understanding Future: Consistency Guided Probabilistic Modeling for Action Anticipation", AAAI Conference on Artificial Intelligence (AAAI), 2024.

56. Liu Liu, Anran Huang, Qi Wu, Dan Guo*, Xun Yang, Meng Wang. "KPA-Tracker: Towards Robust and Real-Time Category-Level Articulated Object 6D Pose Tracking". AAAI Conference on Artificial Intelligence (AAAI), 2024.

57. Xinyi Wu, Wentao Ma, Dan Guo, Tongqing Zhou, Shan Zhao, Zhiping Cai. "Text-based Occluded Person Re-identification via Multi-Granularity Contrastive Consistency Learning", AAAI Conference on Artificial Intelligence (AAAI), 2024.

58. Peipei Song, Dan Guo*, Xun Yang, Shengeng Tang, and Meng Wang. "Emotional Video Captioning with Vision-based Emotion Interpretation Network", IEEE Transactions on Image Processing (IEEE TIP, Trans.), 2024.

59. Zhao Xie, Chang Jiao, Kewei Wu*, Dan Guo* and Richang Hong. "Active Factor Graph Network for Group Activity Recognition", IEEE Transactions on Image Processing (IEEE TIP, Trans.), 2024.

60. Dan Guo, Kun Li*, Bin Hu, Yan Zhang, Meng Wang*. "Benchmarking Micro-action Recognition: Dataset, Methods, and Applications", IEEE Transactions on Circuits and Systems for Video Technology. (IEEE TCSVT, Trans.), 2024.

61. Feiyang Liu, Kun Li, Zhun Zhong, Wei Jia, Bin Hu, Xun Yang*, Meng Wang*, Dan Guo*. "Depth Matters: Spatial Proximity-based Gaze Cone Generation for Gaze Following in Wild", ACM Transactions on Multimedia Computing, Communications and Applications (ACM TOMCCAP , Trans.), 2024.

62. Xin Liu, Biao Qian, Haipeng Liu*, Dan Guo, Yang Wang, Meng Wang*. "Seeking False Hard Negatives for Graph Contrastive Learning", IEEE Transactions on Circuits and Systems for Video Technology. (IEEE TCSVT, Trans.), 2024.

63. Kewei Wu , Wenjie Luo , Zhao Xie , Dan Guo , Zhao Zhang , and Richang Hong. "Ensemble Prototype Network For Weakly-Supervised Temporal Action Localization", IEEE Transactions on Neural Networks and learning systems (IEEE TNNLS, Trans.), 2024.

64. Wei Qian, Dan Guo*, Kun Li, Xiaowei Zhang, Xilan Tian, Xun Yang, Meng Wang*. "Dual-path TokenLearner for Remote Photoplethysmography-based Physiological Measurement with Facial Videos", IEEE Transactions on Computational Social Systems (IEEE TCSS, Trans.), 2024.

2023

65. Peipei Song, Dan Guo*, Xun Yang, Shengeng Tang, Erkun Yang, and Meng Wang*. "Emotion-Prior Awareness Network for Emotional Video Captioning", ACM International Conference on Multimedia (ACM MM, Oral paper, top 5.4%), 2023.

66. Sheng Zhou, Dan Guo*, Jia Li, Xun Yang*, and Meng Wang. "Exploring Sparse Spatial Relation in Graph Inference for Text-Based VQA", IEEE Transactions on Image Processing (TIP, Trans.), 2023.

67. Kun Li, Dan Guo*, and Meng Wang*. "ViGT: Proposal-free Video Grounding with Learnable Token in Transformer", Science China Information Sciences (SCIS)， 2023.

68. Xinge Peng, Kun Li*, Jiaxiu Li, Guoliang Chen, and Dan Guo*. "Multi-modality Fusion for Emotion Recognition in Videos", IJCAI Challenge paper, 2023.

69. Kun Li, Dan Guo*, Guoliang Chen, Xinge Peng, and Meng Wang. "Joint Skeletal and Semantic Embedding Loss for Micro-gesture Classification", IJCAI Challenge paper, 2023.

70. Jia Li, Wei Qian, Kun Li, Qi Li, Dan Guo*, and Meng Wang*. "Exploiting Diverse Feature for Multimodal Sentiment Analysis", ACM MM Challenge paper, 2023.

71. Kun Li, Dan Guo* , Guoliang Chen, Feiyang Liu and Meng Wang. "Data Augmentation for Human Behavior Analysis in Multi-Person Conversations", ACM MM Challenge paper, 2023.

72. Kun Li, Jiaxiu Li, Dan Guo*, Xun Yang*, and Meng Wang. "Transformer-based Visual Grounding with Cross-modality Interaction", ACM Transactions on Multimedia Computing, Communications and Applications (ACM TOMCCAP, Trans.), 2023.

73. Qi Li, Dan Guo*, Wei Qian, Xilan Tian, Xiao Sun, Haifeng Zhao, and Meng Wang*. "Channel-wise Interactive Learning for Remote Heart Rate Estimation from Facial Video", IEEE Transactions on Circuits and Systems for Video Technology (IEEE TCSVT, Trans.),2023.

74. Jing Zhang, Dan Guo*, Xun Yang*, Peipei Song, and Meng Wang*. "Visual-Linguistic-Stylistic Triple Reward for Cross-Lingual Image Captioning", ACM Transactions on Multimedia Computing, Communications and Applications (ACM TOMCCAP, Trans.), 2023.

75. Sheng Zhou, Dan Guo*, Xun Yang*, Jianfeng Dong, and Meng Wang*. "Graph Pooling Inference Network for Text-Based VQA", ACM Transactions on Multimedia Computing, Communications and Applications (ACM TOMCCAP, Trans.), 2023.

76. Shuaiyang Li, Dan Guo, Kang Liu, Richang Hong, and Feng Xue. "Multimodal Counterfactual Learning Network for Multimedia-based Recommendation", Proceedings of the 46th International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR), 2023.

77. Kang Liu, Feng Xue*, Dan Guo, Peijie Sun, Shengsheng Qian, and Richang Hong. "Multimodal Graph Contrastive Learning for Multimedia-based Recommendation", IEEE Transactions on Multimedia (IEEE TMM, Trans.), 2023.

78. Wentao Ma, Xinyi Wu, Shan Zhao*, Tongqing Zhou*, Dan Guo, Lichuan Gu, Zhiping Cai, and Meng Wang. "FedSH: Towards Privacy-preserving Text-based Person Re-Identification", IEEE Transactions on Multimedia (IEEE TMM, Trans.), 2023.

79. Kang Liu, Feng Xue*, Dan Guo, Le Wu, Shujie Li, and Richang Hong. "MEGCF: Multimodal Entity Graph Collaborative Filtering for Personalized Recommendation", ACM Transactions on Information Systems (ACM TOIS, Trans), 2023.

80. Feng Xue*, Tian Yang, Kang Liu, Zikun Hong, Mingwei Cao, Dan Guo, and Richang Hong. "LCSNet: End-to-end Lipreading with Channel-aware Feature Selection", ACM Transactions on Multimedia Computing, Communications, and Applications (ACM TOMM, Trans.), 2023.

81. Dan Guo, Shentao Yao, Hui Wang, Meng Wang. “Embedding VLAD in Transformer for Video Question Answering” [J]. CHINESE JOURNAL OF COMPUTERS, 2023.

2022

82. Jinxing Zhou, Dan Guo* and Meng Wang*. "Contrastive Positive Sample Propagation along the Audio-Visual Event Line", IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI, IF 24.314), 2022.

83. Shengeng Tang, Richang Hong*, Dan Guo*, and Meng Wang, "Gloss Semantic-Enhanced Network with Online Back-Translation for Sign Language Production", ACM International Conference on Multimedia (ACM MM), 2022.

84. Peipei Song, Dan Guo*, Jun Cheng, and Meng Wang*, "Contextual Attention Network for Emotional Video Captioning", IEEE Transactions on Multimedia (TMM, Trans.), 2022.

85. Peipei Song, Dan Guo*, Jinxing Zhou, Mingliang Xu, and Meng Wang*, "Memorial GAN with Joint Semantic Optimization for Unpaired Image Captioning", IEEE Transactions on Cybernetics (TCYB, Trans.), 2022.

86. Jinxing Zhou, Jianyuan Wang, Jiayi Zhang, Weixuan Sun, Jing Zhang, Stan Birchfield, Dan Guo, Meng Wang*, and Yiran Zhong*, "Audio−Visual Segmentation", European Conference on Computer Vision (ECCV), 2022.

87. Tianyuan Xu, Xueliang Liu*, Zhen Huang*, Dan Guo, Richang Hong, and Meng Wang. "Early-Learning regularized Contrastive Learning for Cross-Modal Retrieval with Noisy Labels", ACM International Conference on Multimedia (ACM MM), 2022.

88. Zhao Xie, Jiansong Chen, Kewei Wu*, Dan Guo, and Richang Hong. "Global Temporal Difference Network for Action Recognition", IEEE Transactions on Multimedia (IEEE TMM, Trans.), 2022.

89. Kang Liu, Feng Xue*, Xiangnan He, Dan Guo, and Richang Hong. "Joint Multi-Grained Popularity-Aware Graph Convolution Collaborative Filtering for Recommendation", IEEE Transactions on Computational Social Systems (IEEE TCSS, Trans.), 2022.

2021

90. Dan Guo, Hui Wang, and Meng Wang*, "Context-Aware Graph Inference with Knowledge Distillation for Visual Dialog", IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI, IF 24.314), 2021.

91. Hui Wang, Dan Guo*, Xiansheng Hua, and Meng Wang*, "Pairwise VLAD Interaction Network for Video Question Answering", ACM International Conference on Multimedia (ACM MM), 2021.

92. Kun Li, Dan Guo*, and Meng Wang*, "Proposal-Free Video Grounding with Contextual Pyramid Network", AAAI Conference on Artificial Intelligence (AAAI), 2021.

93. Shengeng Tang, Dan Guo*, Richang Hong*, and Meng Wang, "Graph-Based Multimodal Sequential Embedding for Sign Language Translation", IEEE Transactions on Multimedia (TMM, Trans.), 2021.

2020

94. Dan Guo, Hui Wang, Shuhui Wang, and Meng Wang*, "Textual-Visual Reference-Aware Attention Network for Visual Dialog", IEEE Transactions on Image Processing (TIP, Trans.), 2020.

95. Dan Guo, Wengang Zhou*, Anyang Li, Houqiang Li, and Meng Wang*, "Hierarchical Recurrent Deep Fusion Using Adaptive Clip Summarization for Sign Language Translation", IEEE Transactions on Image Processing (TIP, Trans.), 2020.

96. Dan Guo, Hui Wang*, Hanwang Zhang, Zhengjun Zha, and Meng Wang*, "Iterative Context-Aware Graph Inference for Visual Dialog", Conference on Computer Vision and Pattern Recognition (CVPR, oral paper, Top 5%), 2020.

97. Dan Guo, Yang Wang*, Peipei Song*, and Meng Wang, "Recurrent Relational Memory Network for Unsupervised Image Captioning", International Joint Conference on Artificial Intelligence (IJCAI, acceptance rate12.6%), 2020.

2019

98. Dan Guo, Kun Li*, and Meng Wang, "DADNet：Dilated-Attention-Deformable ConvNet for Crowd Counting", ACM International Conference on Multimedia (ACM MM, oral paper, Top 9.8%), 2019.

99. Dan Guo, Shengeng Tang,and Meng Wang, "Connectionist Temporal Modeling of Video and Language：A Joint Model for Translation and Sign Labeling", International Joint Conference on Artificial Intelligence (IJCAI), 2019.

100. Dan Guo, Shuo Wang, Qi Tian, and Meng Wang, "Dense Temporal Convolution Network for Sign Language Translation", International Joint Conference on Artificial Intelligence (IJCAI), 2019.

101. Dan Guo, Hui Wang, and Meng Wang, "Dual Visual Attention Network for Visual Dialog", International Joint Conference on Artificial Intelligence (IJCAI), 2019.

102. Shuo Wang, Dan Guo*, Xin Xu, Li Zhuo, and Meng Wang, "Cross-Modality Retrieval by Joint Correlation Learning", ACM Transactions on Multimedia Computing Communications and Applications (ACM TOMCCAP, Trans.), 2019.

2018 and Earlier

103. Shuo Wang, Dan Guo*, Wengang Zhou, Zhengjun Zha, and Meng Wang, "Connectionist Temporal Fusion for Sign Language Translation", International ACM International Conference on Multimedia (ACM MM), 2018.

104. Dan Guo, Wengang Zhou, Houqiang Li, and Meng Wang, "Hierarchical LSTM for Sign Language Translation", AAAI Conference on Artificial Intelligence (AAAI, oral paper, Top 5%), 2018.

105. Dan Guo, Wengang Zhou*, Houqiang Li*, and Meng Wang*, "Online Early-Late Fusion Based on Adaptive HMM for Sign Language Recognition", ACM Transactions on Multimedia Computing Communications and Applications (ACM TOMCCAP, Trans.), 2018.

106. Zhihong Lu, Dan Guo *, and Meng Wang. “Motion-compensated Frame Interpolation Based on Weighted Motion. ACTA AUTOMATICA SINICA, 2015.

Patents

Holds 44 national patents, with 34 of them being authorized.

[1] Dan Guo; Zheng Zhang; Jiabao Guo; Fei Wang; Meng Wang; A three-dimensional micro-motion magnification method based on 3D Gaussian, March 31, 2026 (under substantive examination), China, 202511590354.0.

[2] Zibo Yan; Wei Qian; Zihang Xu; Longlong Yan; Xiaoning Tian; Dan Guo; A remote heart rate detection method based on domain adaptation, September 30, 2025 (under substantive examination), China, 202510497875.5.

[3] Dan Guo; Gaoji Su; Wei Qian; Jinyang Huang; Zhangling Duan; Meng Wang; A remote physiological signal estimation method and system based on diffusion models, May 6, 2025 (granted), China, 202510186180.5.

[4] Jinyang Huang; Yutong Guo; Jiacheng Zhao; Hanzhen Li; Shuangzhen Hu; Muyang Zhou; Aoxiang Shan; Meng Wang; Xiang Zhang; Huan Yan; Dan Guo; Meng Wang; A contactless pen-holding posture calibration method and system based on horizontal and vertical stroke decomposition, September 26, 2025 (granted), China, 202511015476.7.

[5] Jinyang Huang; Yutong Guo; Jiacheng Zhao; Fengqi Cui; Tianyue Zheng; Dan Guo; Meng Wang; An emotion detection method based on spatiotemporal feature fusion of facial keypoints, November 25, 2025 (granted), China, 202511370987.0.

[6] Jingjing Hu; Jing Zhang; Yao Zhao; Dan Guo; A human activity detection system and method based on time-frequency dual-path sensor fusion, August 5, 2025 (under substantive examination), China, 202510375134.X.

[7] Dan Guo; Jiahui Sun; Jing Zhang; A grammar-controllable video caption generation method and system based on dynamic gated decoding, August 26, 2025 (under substantive examination), China, 202510617010.8.

[8] Dan Guo; Shuqing Sun; Peijie Sun; Meng Wang; An intent-based purchase preference-aware multi-behavior recommendation method, November 25, 2025 (under substantive examination), China, 202510850552.X.

[9] Dan Guo; Dongxing Duan; Jingyuan Xu; Feiyang Liu; Meng Wang; A pixel-level gaze target prediction method based on multimodal joint optimization, December 26, 2025 (under substantive examination), China, 202511246581.1.

[10] Jinxing Zhou; Dan Guo; Zhangbin Li; Meng Wang; An audio-visual video question answering method and system based on multimodal heterogeneous graphs, March 25, 2025 (granted), China, 202411823994.7.

[11] Shengeng Tang; Jun Yao; Xu Wang; Xueyu Xiu; Xiaohu Dong; Weiyin Tan; Dan Guo; A sign language generation system and method based on multimodal semantic interaction enhancement, November 12, 2024 (granted), China, 202410630950.6.

[12] Jiehui Tang; Xueliang Liu; Dan Guo; Yichen Cai; Jinyan Zhang; Yulu Ye; A lightweight personalized face visual dubbing method, July 26, 2024 (granted), China, CN202410661845.9.

[13] Dan Guo; Feiyang Liu; Kun Li; Meng Wang; A gaze target estimation method based on progressive field-of-view cones, April 9, 2024 (granted), China, 202410100320.8.

[14] Jinxing Zhou; Dan Guo; Ziheng Zhou; Meng Wang; An audio-visual event localization system and method based on cross-modal consistency and temporal multi-granularity collaboration, February 11, 2025 (granted), China, 202411661256.7.

[15] Dan Guo; Feiyang Liu; Kun Li; Meng Wang; A gaze target estimation method based on progressive field-of-view cones, January 23, 2024 (under substantive examination), China, 202410100320.8.

[16] Xun Yang; Sheng Zhou; Peipei Song; Dan Guo; Meng Wang; A scene text visual question answering method based on graph pooling inference networks, February 20, 2024 (under substantive examination), China, 202311431250.6.

[17] Fei Wang; Dan Guo; Kun Li; Meng Wang; A video motion magnification method based on Transformer networks, January 2, 2026 (granted), China, 202310481761.2.

[18] Zihang Xu; Yangjun Huang; Changlin Chen; Yi He; Murou Li; Zan Huang; Dan Guo; A domain adaptive image classification method based on regularized joint self-training, September 16, 2025 (granted), China, 202310150489.X.

[19] Shengeng Tang; Tonghuan Xiao; Dan Guo; Jihao Gu; Chenxi Cao; Wanqiang Song; Bin Huang; A collision warning method based on image object detection and visual depth estimation, January 2, 2026 (granted), China, CN202310188292.5.

[20] Shengeng Tang; Wanqiang Song; Dan Guo; Bin Huang; Jihao Gu; Tonghuan Xiao; Chenxi Cao; A route planning method for visually impaired individuals based on weighted undirected graphs, March 6, 2023 (under substantive examination), China, CN202310228006.3.

[21] Peipei Song; Dan Guo; Xinyi Long; Meng Wang; Generation method and application of video emotion description model driven by visual emotions, February 24, 2026 (granted), China, 202210982424.7.

[22] Dan Guo; Zekuan Liu; Yichen Guo; Shengeng Tang; Zilong Wu; Zehan Wen; Yingnan Chen; A WiFi-based sign language translation system and method based on deep learning, September 16, 2025 (granted), China, 202210805408.0.

[23] Dan Guo; Qi Li; Xiao Sun; Jie Huang; Meng Wang; End-to-end remote heart rate detection method based on channel-enhanced spatiotemporal attention network, April 26, 2024 (granted), China, 202210507744.7.

[24] Tianyi Lu; Dan Guo; An action-guided video captioning method, June 29, 2022 (granted), China, 202210829622.X.

[25] Dan Guo; Wei Qian; Xiwei Zhang; Xueliang Liu; Fangbing Wang; Meng Wang; A face video heart rate estimation system and method based on token learning, October 25, 2024 (granted), China, 202210506179.2.

[26] Dan Guo; Ziyi He; Youwei Ni; Kun Li; Zixin Xu; Jiaqi Ma; Kuang Luo; A dishwashing device based on object detection (Utility Model), May 12, 2023 (granted), China, ZL202220873705.4.

[27] Dan Guo; Jihao Gu; Shengeng Tang; Tonghuan Xiao; Chenxi Cao; Wanqiang Song; An outdoor visual impairment assistance method based on deep intelligent interaction, February 20, 2024 (granted), China, 202210371804.7.

[28] Dan Guo; Chenxi Cao; Tonghuan Xiao; Shengeng Tang; Jihao Gu; Bin Huang; A selective direction deviation warning system and method based on semantic segmentation, February 27, 2024 (granted), China, 202210374860.6.

[29] Ye Zhao; Xiaobin Hu; Zhenzhen Hu; Xueliang Liu; Dan Guo; Yanrong Guo; Le Wu; A method and device for generating video summary descriptions based on attention models, December 9, 2022 (granted), China, ZL202110565400.7.

[30] Dan Guo; Shengeng Tang; Xianglong Liu; Richang Hong; Meng Wang; A multimodal fusion sign language recognition system and method based on graph convolution, March 14, 2023 (granted), China, ZL202010049714.7.

[31] Dan Guo; Shengeng Tang; Xianglong Liu; Meng Wang; A sign language translation system and method based on multi-level semantic parsing, March 28, 2023 (granted), China, ZL202010103960.6.

[32] Dan Guo; Peipei Song; Xianglong Liu; Meng Wang; A method for generating an unsupervised image description model based on recursive memory networks, March 15, 2022 (granted), China, ZL202010049142.2.

[33] Dan Guo; Peipei Song; Xianglong Liu; Meng Wang; A method for sign language translation based on data-driven multi-level feature dynamic fusion, March 15, 2022 (granted), China, ZL202010096391.7.

[34] Dan Guo; Hui Wang; Meng Wang; A method for visual dialogue generation based on context-aware graph neural networks, June 8, 2021 (granted), China, ZL201910881298.4.

[35] Dan Guo; Kun Li; Meng Wang; A crowd density estimation method based on multi-scale attention mechanism, March 9, 2021 (granted), China, ZL201910531606.0.

[36] Dan Guo; Peipei Song; Ye Zhao; Meng Wang; A multi-feature fusion sign language recognition method based on adaptive hidden Markov models, July 10, 2020 (granted), China, ZL201811131806.9.

[37] Dan Guo; Meng Wang; Wengang Zhou; Houqiang Li; Chuanqing Li; Anyang Li; An Asymmetric Multilayer LSTM-Based Approach for Automatic Translation of Continuous Sign Language Videos, February 11, 2020 (granted), China, ZL201810027551.5.

[38] Dan Guo; Shuo Wang; Meng Wang; A Sign Language Video Translation Method Based on the Fusion of Temporal Domain Convolutional Networks and Recurrent Neural Networks, October 18, 2019 (granted), China, ZL201811070290.1.

[39] Meng Wang; Luming Zhang; Dan Guo; A fast recognition system and a fast recognition method for aerial images based on multi-task topology learning, February 6, 2018 (granted), China, ZL201510080478.4.

[40] Dan Guo; Xuegang Hu; Wu Ni; Xindong Wu; A road network evacuation planning method based on maximum flow rate path priority, June 6, 2017 (granted), China, ZL201510451828.3.

[41] Meng Wang; Luming Zhang; Dan Guo; Xuting Tian; A viewpoint tracking method based on geometric reconstruction and semantic fusion, October 3, 2017 (granted), China, ZL201410733763.7.

[42] Meng Wang; Xun Yang; Richang Hong; Dan Guo; Yiqun Liu; Maosong Sun; An image retrieval method based on semantic mapping space construction, May 17, 2017 (granted), China, ZL201410393094.3.

[43] Meng Wang; Richang Hong; Bingnan Li; Yiqun Liu; Dan Guo; Xueliang Liu; Xindong Wu; Xun Yang; A retrieval re-ranking method based on continuous numeric label subspace learning, February 22, 2017 (granted), China, ZL201410196946.X.

[44] Meng Wang; Luming Zhang; Dan Guo; Yiqun Liu; Maosong Sun; Zhihong Lu; A 3D scene reconstruction method based on GPS-information videos, February 22, 2017 (granted), China, ZL201410752454.4.

Published Books

English monograph

[1] Multimedia for Accessible Human Computer Interfaces. Springer. 2021.

[2] Pattern Matching with Wildcards and Length Constraint. Science Press. 2016.

Computer software copyright

[1] Xiyi Long; Ruyue Jin; Jinjun Yi; Peipei Song; Dan Guo; Real-time multi-modal fake news detection system in multiple fields V1.0, 2023R11L1048667, original acquisition, all rights, 2023-11-15.

[2] Shengeng Tang; Xueyu Xiu; Dan Guo; Xiaohu Dong; Jun Yao; Weihao Xie; Cross-language sign language translation system V1.0, 2023SR1107827, original acquisition, all rights, 2023-09-20.

[3] Shengeng Tang; Bin Huang; Dan Guo; Jihao Gu; Blind obstacle avoidance travel assistance system V1.0, 2023SR0517944, original acquisition, all rights, 2023-05-05.

[4] Dan Guo; Shengeng Tang; Yinnan Chen; ZiLong Wu; Zehan Wen; Zekuan Liu; Human posture cartoonization system based on key point estimation V1.0, 2022SR0771364, original acquisition, all rights reserved, 2022-06-16.

[5] Zhihong Lu; Dan Guo; Jingwei Wu; Fei Liu; Lijin Zhang; Xuting Tian; Video HD playback software based on motion compensation V1.0, 2014SR098634, original acquisition, all rights reserved, 2014-07-16.

Grants and Awards

Grants

· Top-notch young talents for young scholars of High-end Talent Cultivation Action Program of Anhui Province, China, 2023-09.

· Outstanding Reviewer Award of IEEE International Conference on Multimedia and Expo (IEEE ICME), 2020-07.

· Outstanding Reviewer Award of Computer Science journal, 2021-12.

Competitions

Received 16 awards in competitive challenges at international conferences, including 9 first-place, 5 second-place, and 2 third-place recognitions.

· IJCAI Challenge on Micro-gesture Analysis for Hidden Emotion Understanding , 1st Place in Micro-gesture classification Track.🏆2025.08.

· IJCAI Challenge on Micro-gesture Analysis for Hidden Emotion Understanding, 1st Place in Multimodality-based online micro-gesture recognition Track.🏆2025.08.

· IJCAI Challenge on Vision-based Remote Physiological Signal Sensing ,1st Place .🏆2025.08.

· IJCAI Challenge on Micro-gesture Analysis for Hidden Emotion Understanding， 1st Place in Micro-gesture Classification Track.🏆2024.08.

· ACM MM Multi-modal Group Behaviour Analysis for Artificial Mediation，1st Place in Bodily Behaviour Recognition Track. 🏆2024.10

· ACM MM Multi-modal Group Behaviour Analysis for Artificial Mediation，1st Place in Eye Contact Detection Track. 🏆2024.10.

· IJCAI Challenge on Micro-gesture Analysis for Hidden Emotion Understanding, 1st Place in Micro-gesture Classification Track.🏆2023.05.

· ACM MM Multi-modal Group Behaviour Analysis for Artificial Mediation, 1st Place in Bodily Behaviour Recognition Track. 🏆2023.07.

· ACM MM Multi-modal Group Behaviour Analysis for Artificial Mediation, 1st Place in Eye Contact Detection Track. 🏆 2023.07.

Research Projects

MORE+

others

No content