合肥工业大学主页平台管理系统唐申庚--中文主页--科学研究

当前位置: 中文主页 >> 科学研究

科研项目

[1] 国家自然科学基金-青年科学基金项目(C类)，基于知识溯因推理的手语视频生成方法研究，2026.01.01-2028.12.31，主持

[2] 安徽省自然科学基金-青年项目，基于跨媒体反绎推理的连续手语翻译方法研究，2024.09.01-2026.08.31，主持

[3] 合肥工业大学学术新人提升计划-A项目，面向多源异构数据的手语视频推理研究，2024.04.01-2025.12.31，主持

[4] 合肥工业大学青年教师科研创新启动专项-A项目，手语视频自动生成技术研究，2023.05.01-2025.04.30，主持

[5] 智能互联系统安徽省实验室自主创新专项，面向手语推理的多模态语义感知与实体关联挖掘研究，2025.01.01-2026.12.31，校内负责人

论文成果

详见谷歌学术主页：https://scholar.google.com/citations?user=_JZcsnYAAAAJ

[2026年]

[1] Lechao Cheng, Jiahui Li, Jingxuan He, Shengeng Tang, Gang Huang, Tianrui Hui, Yaxiong Wang, Zhun Zhong. SplitGaussian: Reconstructing Dynamic Scenes via Visual Geometry Decomposition. ACM International Conference on Multimedia (ACM MM), 2026. (CCF A)

[2] Wan Jiang, Wenle Yu, Xue Wang, Xiaojing Chen, Hui Zhang, Jingjing Wu, Shengeng Tang, Richang Hong. Support-Aware Transmittance Refinement for Fine-Grained Occlusion Control in Image Generation. ACM International Conference on Multimedia (ACM MM), 2026. (CCF A)

[3] Kaifeng Chen, Lechao Cheng, Jiyang Li, Shengeng Tang, Fan Zhang, Yantao Pan, Yaxiong Wang, Tianrui Hui, Zhun Zhong. Robust Trajectory Distillation: Hybrid Reweighting Meets Teacher-Inspired Targets. European Conference on Computer Vision (ECCV), 2026. (CCF B)

[4] Jinjie Shen, Jing Wu, Yaxiong Wang, Lechao Cheng, Shengeng Tang, Tianrui Hui, Nan Pu, Zhun Zhong. OmniVL-Guard: Towards Unified Vision-Language Forgery Detection and Grounding via Balanced RL. International Conference on Machine Learning (ICML), 2026. (CCF A)

[5] Ruobei Zhang, Shengeng Tang*, Huan Yan, Xiang Zhang, Jiabao Guo*. Wi-CBR: Salient-aware Adaptive WiFi Sensing for Cross-domain Behavior Recognition. AAAI Conference on Artificial Intelligence (AAAI), 2026, 40(2): 1552-1560. (CCF A) [Link] [*Corresponding authors]

[6] Yu Fei, Quan Deng, Shengeng Tang, Yuehua Li, Lechao Cheng. Open-World 3D Scene Graph Generation for Retrieval-Augmented Reasoning. AAAI Conference on Artificial Intelligence (AAAI), 2026, 40(5): 3894-3902. (CCF A, Oral Paper)

[7] Lin Liu, Shuo Wang, Jinda Lu, Junxiang Qiu, Huixia Ben, Shengeng Tang, Yanbin Hao. Accelerating Controllable Generation via Hybrid-grained Cache. AAAI Conference on Artificial Intelligence (AAAI), 2026, 40(9): 7215-7223. (CCF A)

[8] Feng Xue, Baochao Zhu, Wei Jia, Shujie Li, Yu Li, Jinrui Zhang, Shengeng Tang, Dan Guo. LinProVSR: Linguistics-Knowledge Guided Progressive Disambiguation Network for Visual Speech Recognition. AAAI Conference on Artificial Intelligence (AAAI), 2026, 40(14): 11505-11513. (CCF A)

[2025年]

[1] Shengeng Tang, Jiayi He, Lechao Cheng, Jingjing Wu, Dan Guo, Richang Hong. Discrete to Continuous: Generating Smooth Transition Poses from Sign Language Observations. IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2025: 3481-3491. (CCF A) [Link]

[2] Shuoyan Wei, Feng Li, Shengeng Tang, Yao Zhao, Huihui Bai. EvEnhancer: Empowering Effectiveness, Efficiency and Generalizability for Continuous Space-Time Video Super-Resolution with Events. IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2025: 17755-17766. (CCF A, Highlight Paper, Top 3.0%) [Link]

[3] Shengeng Tang, Jiayi He, Dan Guo, Yanyan Wei, Feng Li, Richang Hong. Sign-IDD: Iconicity Disentangled Diffusion for Sign Language Production. AAAI Conference on Artificial Intelligence (AAAI), 2025, 39(7): 7266-7274. (CCF A, Oral Paper, Top 4.6%) [Link]

[4] Ziheng Zhou, Jinxing Zhou, Wei Qian, Shengeng Tang, Xiaojun Chang, Dan Guo. Dense Audio-Visual Event Localization under Cross-Modal Consistency and Multi-Temporal Granularity Collaboration. AAAI Conference on Artificial Intelligence (AAAI), 2025, 39(10): 10905-10913. (CCF A) [Link]

[5] Wei Qian, Gaoji Su, Dan Guo, Jinxing Zhou, Xiaobai Li, Bin Hu, Shengeng Tang, Meng Wang. PhysDiff: Physiology-based Dynamicity Disentangled Diffusion Model for Remote Physiological Measurement. AAAI Conference on Artificial Intelligence (AAAI), 2025, 39(6): 6568-6576. (CCF A, Oral Paper, Top 4.6%) [Link]

[6] Zhangbin Li, Jinxing Zhou, Jing Zhang, Shengeng Tang, Kun Li, Dan Guo. Patch-level Sounding Object Tracking for Audio-Visual Question Answering. AAAI Conference on Artificial Intelligence (AAAI), 2025, 39(5): 5075-5083. (CCF A) [Link]

[7] Fangwen Wu, Lechao Cheng, Shengeng Tang, Xiaofeng Zhu, Chaowei Fang, Dingwen Zhang, Meng Wang. Navigating Semantic Drift in Task-Agnostic Class-Incremental Learning. International Conference on Machine Learning (ICML), 2025. (CCF A, Oral Paper, Top 1.0%) [Link]

[8] Mingyu Xing, Lechao Cheng, Shengeng Tang, Yaxiong Wang, Zhun Zhong, Meng Wang. Knowledge Swapping via Learning and Unlearning. International Conference on Machine Learning (ICML), 2025. (CCF A) [Link]

[9] Mingce Guo, Jingxuan He, Yufei Yin, Zhangye Wang, Shengeng Tang, Lechao Cheng. Shaping a Stabilized Video by Mitigating Unintended Changes for Concept-Augmented Video Editing. International Joint Conference on Artificial Intelligence (IJCAI), 2025: 1062-1070. (CCF B)

[10] Xu Wang, Shengeng Tang*, Peipei Song, Shuo Wang, Dan Guo, Richang Hong. Linguistics-Vision Monotonic Consistent Network for Sign Language Production. IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2025. (CCF B, 清华大学顶尖级国际会议) [*Corresponding author] [Link]

[11] Jiaqi Zhao, Fei Wang, Kun Li, Yanyan Wei, Shengeng Tang, Shu Zhao, Xiao Sun. Temporal-Frequency State Space Duality: An Efficient Paradigm for Speech Emotion Recognition. IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2025. (CCF B) [Link]

[12] Zhenqiang Zhang, Kun Li, Shengeng Tang, Yanyan Wei, Fei Wang, Jinxing Zhou, Dan Guo. Temporal Boundary Awareness Network for Repetitive Action Counting. ACM Transactions on Multimedia Computing, Communications, and Applications (TOMM), 2025, 21(4): 1-22. (CCF B, SCI 1区, IF=6.0) [Link]

[13] Kezhou Chen, Huixia Ben, Shuo Wang, Shengeng Tang, Yanbin Hao. Mixture of Multimodal Adapters for Sentiment Analysis. Nations of the Americas Chapter of the Association for Computational Linguistics (NAACL), 2025, 1: 1822-1833. (CCF B) [Link]

[14] Jiayi He, Shengeng Tang*, Ao Liu, Lechao Cheng, Jingjing Wu, Yanyan Wei. Efficient Vision Language Model Fine-tuning for Text-based Person Anomaly Search. ACM Web Conference Workshop on Multimedia Object Re-ID (WWW-MORE), 2025: 1568-1572. (CCF A Workshop) [*Corresponding author] [Link]

[15] Chenglong Xu, Peipei Song, Shengeng Tang, Dan Guo, Xun Yang. Alleviating Confirmation Bias in Learning with Noisy Labels via Two-Network Collaboration. ACM Transactions on Intelligent Systems and Technology (TIST), 2025. (CAA A, SCI 1区, IF=6.6) [Link]

[16] Mingwang Wu, Yuetong Luo, Yankong Zhang, Bo Zhou, Shengeng Tang*, Lechao Cheng. Exploring Effective Unfolding Covering Prompt Tuning for Vision Mamba. IEEE International Conference on Image Processing (ICIP), 2025. (CCF C) [*Corresponding author]

[17] Ziqiu Dong, Yuetong Luo, Bo Zhou, Yankong Zhang, Shengeng Tang*, Lechao Cheng. Efficient Asymmetric Shared Low-Rank Adaptation based on Selective Scanning Vision Mamba for Medical Imaging Analysis. IEEE International Conference on Image Processing (ICIP), 2025. (CCF C) [*Corresponding author]

[18] Yu Li, Feng Xue, Dan Guo, Shengeng Tang, Peng Li, Shujie Li, Richang Hong. CFLip: Generalizing Lipreading to Unseen Speakers by Learning Common Features. IEEE Transactions on Computational Social Systems (TCSS), 2025. (CAA A, CCF C, SCI 1区, IF=4.9) [Link]

[19] Jiashu He (本科生), Jiayi He, Shengeng Tang*, Huixia Ben, Lechao Cheng, Richang Hong. StgcDiff: Spatial-Temporal Graph Condition Diffusion for Sign Language Transition Generation. ACMMM 2025 Workshop on Deep Multimodal Generation and Retrieval (ACMMM-MMGR), 2025. (CCF A Workshop) [*Corresponding author]

[19] Jiabao Guo, Yadian Wang, Hui Ma, Yuhao Fu, Ju Jia, Hui Liu, Shengeng Tang, Lechao Cheng, Yunfeng Diao, Ajian Liu. Spoofing-aware Prompt Learning for Unified Physical-Digital Facial Attack Detection. ICCV 2025 Workshop on Unified Physical-Digital Face Attack Detection (ICCVW), 2025. (CCF A Workshop)

[20] Qiuli Zhou, Jingyuan Yao, Shengeng Tang, Weidong Chen, Lechao Cheng, Jun Tang*. Hierarchical Knowledge Distillation for Cross-Lingual Stance Detection. International Conference on Artificial Intelligence, Human-Computer Interaction and Robotics (AIHCIR), 2025. (Best Paper Award)

[2024年]

[1] Peipei Song, Dan Guo, Xun Yang, Shengeng Tang, Meng Wang. Emotional Video Captioning with Vision-based Emotion Interpretation Network. IEEE Transactions on Image Processing (TIP), 2024, 33: 1122-1135. (CCF A, SCI 1区, IF=13.7) [Link]

[2] Shengeng Tang, Feng Xue, Jingjing Wu, Shuo Wang, Richang Hong. Gloss-driven Conditional Diffusion Models for Sign Language Production. ACM Transactions on Multimedia Computing, Communications, and Applications (TOMM), 2025, 21(4): 1-17. (CCF B, SCI 1区, IF=6.0) [Link] (ESI 高被引论文, Top 1%)

[3] Jingjing Wu, Richang Hong, Shengeng Tang. Intermediary-Generated Bridge Network for RGB-D Cross-modal Re-identification. ACM Transactions on Intelligent Systems and Technology (TIST), 2024, 15(6): 1-25. (CAA A, SCI 1区, IF=6.6) [Link]

[2023年及之前]

[1] Shengeng Tang, Richang Hong, Dan Guo, Meng Wang. Gloss Semantic-Enhanced Network with Online Back-Translation for Sign Language Production. ACM International Conference on Multimedia (ACM MM), 2022: 5630-5638. (CCF A) [Link]

[2] Shengeng Tang, Dan Guo, Richang Hong, Meng Wang. Graph-Based Multimodal Sequential Embedding for Sign Language Translation. IEEE Transactions on Multimedia (TMM), 2022, 24: 4433-4445. (CCF A, SCI 1区, IF=9.7) [Link]

[3] Peipei Song, Dan Guo, Xun Yang, Shengeng Tang, Erkun Yang, Meng Wang. Emotion-Prior Awareness Network for Emotional Video Captioning. ACM International Conference on Multimedia (ACM MM), 2023: 589-600. (CCF A, Oral Paper, Top 5.4%) [Link]

[4] Dan Guo, Shengeng Tang, Meng Wang. Connectionist Temporal Modeling of Video and Language: A Joint Model for Translation and Sign Labeling. International Joint Conference on Artificial Intelligence (IJCAI), 2019: 751-757. (CCF B) [Link]

[5] Dan Guo, Shengeng Tang, Richang Hong, Meng Wang. Sign Language Recognition. Multimedia for Accessible Human Computer Interfaces. Springer, Cham, 2021: 23-59. [Link]

专利成果

详见专利之星网站：https://cprs.patentstar.com.cn/Search/ResultList?CurrentQuery=5ZSQ55Sz5bqaL1lZ&type=cn

[1] 唐申庚; 王旭; 程乐超; 郭丹; 洪日昌; 基于跨模态语义关联学习的运动姿态生成方法, 2025-02-11, 中国, ZL202411612365.X. (授权)

[2] 唐申庚; 姚骏; 王旭; 修雪玉; 董晓虎; 谭惟尹; 郭丹; 一种基于多模态语义交互增强的手语生成系统及方法, 2024-11-12, 中国, ZL202410630950.6. (授权)

[3] 唐申庚; 何佳一; 何家澍; 王硕; 程乐超; 洪日昌; 基于扩散模型的相似性解纠缠运动姿态生成方法, 2026-03-03, 中国, ZL202510492536.8. (授权)

[4] 唐申庚; 肖同欢; 郭丹; 谷纪豪; 曹晨曦; 宋万强; 黄滨; 一种基于图像目标检测和视觉深度估计的碰撞预警方法, 2026-01-02, 中国, ZL202310188292.5. (授权)

[5] 唐申庚; 张光宗; 闫菲菲; 奚海庭; 李坤; 程乐超; 基于动作单元先验及微表情增强的表情定位方法及系统, 2026-05-15, 中国, ZL202610187252.2. (授权)

[6] 郭丹; 唐申庚; 刘祥龙; 洪日昌; 汪萌; 一种基于图卷积的多模态融合手语识别系统及方法, 2023-03-14, 中国, ZL202010049714.7. (授权)

[7] 郭丹; 唐申庚; 刘祥龙; 汪萌; 一种基于多层次语义解析的手语翻译系统及方法, 2023-03-28, 中国, ZL202010103960.6. (授权)

[8] 张昵昵; 唐申庚; 何家澍; 何佳一; 程乐超; 钟准; 一种基于条件扩散模型的数字人姿态动作生成方法, 2026-03-20, 中国, ZL202510705002.9. (授权)

[9] 肖昌昊; 唐申庚; 钱威; 柳虹宇; 年付盛; 周金星; 基于状态空间与双路径交互的远程生理信号检测方法及系统, 2026-03-24, 中国, ZL202510705002.9. (授权)

[10] 肖昌昊; 唐申庚; 钱威; 马绘; 程乐超; 郭丹; 基于自适应滤波器的远程生理信号检测方法、终端及介质, 2026-03-24, 中国, ZL202510705006.7. (授权)

[11] 马绘; 唐申庚; 胡金鹏; 时增林; 汪萌; 基于层次交互学习的对话情感和行为联合识别方法及系统, 2025-06-20, 中国, ZL202510414705.6. (授权)

[12] 焦云鹏; 唐申庚; 王旭; 胡金鹏; 马绘; 程乐超; 郝艳宾; 一种基于情绪先验与低维残差校准的人脸关键点生成方法, 2026-06-05, 中国, ZL202610628371.7. (授权)

[13] 刁云峰; 姜凯超; 唐申庚; 郭丹; 汪萌; 一种针对人工智能合成图像的对抗鲁棒鉴伪方法, 2024-12-24, 中国, ZL202411482098.9. (授权)

[14] 郭丹; 谷纪豪; 唐申庚; 肖同欢; 曹晨曦; 宋万强; 一种基于深度智能交互的室外视障辅助方法, 2024-02-20, 中国, ZL202210371804.7. (授权)

[15] 郭丹; 刘泽宽; 郭义臣; 唐申庚; 武梓龙; 文则涵; 陈颖男; 一种基于深度学习的WiFi手语翻译系统及方法, 2025-09-16, 中国, ZL202210805408.0. (授权)

[16] 郭丹; 曹晨曦; 肖同欢; 唐申庚; 谷纪豪; 黄滨; 一种基于语义分割的择优式方向偏移预警系统和方法, 2024-02-27, 中国, ZL202210374860.6. (授权)

[17] 杨勋; 徐成龙; 宋培培; 郝艳宾; 唐申庚; 一种基于双网络协作的抗噪音标签图像识别方法, 2026-06-05, 中国, ZL202411126873.7. (授权)

[18] 唐申庚; 宋万强; 郭丹; 黄滨; 谷纪豪; 肖同欢; 曹晨曦; 一种基于带权无向图的视障人士路线规划方法, 2023-03-06, 中国, CN202310228006.3. (实审)

[19] 程乐超; 邢明煜; 唐申庚; 王亚雄; 钟准; 汪萌; 一种基于先学习后遗忘的知识交换方法及其应用, 2025-04-30, 中国, CN202510566020.3. (实审)

[20] 罗月童; 张奥楠; 董子秋; 唐申庚; 程乐超; 面向Vmamba的提示调整与选择嵌入相结合的目标检测方法, 2025-04-01, 中国, CN202510401427.0. (实审)

[21] 宋培培; 杨勋; 徐军军; 唐申庚; 王硕; 一种基于模态间互补性挖掘的多模态情感分析方法, 2024-04-12, 中国, CN202410442083.3. (实审)

[22] 郝艳宾; 雷俊杰; 刘鹏宇; 唐申庚; 程乐超; 郭丹; 一种基于多模态的视频情绪识别方法, 2026-05-07, 中国, CN202610611644.7. (实审)

著作成果

[1] 唐申庚; 黄滨; 郭丹; 谷纪豪; 盲人避障出行辅助系统 V1.0, 2023SR0517944, 原始取得, 全部权利, 2023-05-05.

[2] 唐申庚; 修雪玉; 郭丹; 董晓虎; 姚骏; 谢伟豪; 跨语言手语翻译系统 V1.0, 2023SR1107827, 原始取得, 全部权利, 2023-09-20.

[3] 唐申庚; 周家豪; 程乐超; 郭丹; 多源数据关联查询与推荐系统 V1.0, 2024SR1773469, 原始取得, 全部权利, 2024-11-13.

[4] 唐申庚; 张凌; 蔺宇辉; 陈晓雅; 刁云峰; 程乐超; 基于多智能体视觉感知的智慧导览系统 V1.0, 2025SR0706401, 原始取得, 全部权利, 2025-04-29.

[5] 唐申庚; 许子耘; 张杰; 郭嘉宝; 张昵昵; 程乐超; 基于Langchain框架的智能体助手系统 V1.0, 2025SR2133677, 原始取得, 全部权利, 2025-11-03.

[6] 唐申庚; 慈原; 冯金戈; 吴晶晶; 王亚雄; 程乐超; 多模态非接触式智能康养监测系统 V1.0, 2026SR0706872, 原始取得, 全部权利, 2026-07-03.

[7] 郭丹; 唐申庚; 陈颖男; 武梓龙; 文则涵; 刘泽宽; 基于关键点估计的人体姿态卡通化系统 V1.0, 2022SR0771364, 原始取得, 全部权利, 2022-06-16.

[8] 张昵昵; 肖昌昊; 马嘉慧; 郭嘉宝; 王旭; 唐申庚; 基于图神经网络的图匹配算法演示系统 V1.0, 2025SR2134525, 原始取得, 全部权利, 2025-11-03.

[9] 肖昌昊; 柳虹宇; 年付盛; 钱威; 唐申庚; 基于多路径协同交互的远程生理监测系统 V1.0, 2025SR0957374, 原始取得, 全部权利, 2025-06-09.

科研项目

暂无内容

论文成果

暂无内容