唐申庚

个人信息Personal Information

硕士生导师

教师拼音名称:tangshengeng

学历:博士研究生毕业

办公地点:翡翠湖校区科教楼A907

学科:计算机应用技术

个人简介Personal Profile

唐申庚,讲师,硕士生导师,安徽省人工智能学会计算机视觉专委会秘书长。研究方向包括手语翻译与生成、视频理解与分析、跨媒体智能推理。2017年本科毕业于湖南师范大学计算机科学与技术专业;2017年至2022年期间,在合肥工业大学计算机应用技术专业硕博连读(导师:洪日昌教授),2022年12月获得工学博士学位。2023年2月起在合肥工业大学计算机与信息学院任讲师。

目前已在ACM MM、IJCAI、IEEE TIP、IEEE TMM等CCF A类会议及IEEE/ACM Trans.期刊上发表论文6篇,参与撰写英文学术专著1项,申请中国发明专利7项(其中授权4项、实审3项),登记软件著作权3项。参与国家自然科学基金重点项目1项、面上项目2项,担任CVPR, ICCV, AAAI, ACM MM, ACM CHI, ECCV, ACCV, IEEE TMM, IEEE TCSVT, ACM TOMM, CVIU, Neural Networks, Neurocomputing等国际期刊与会议审稿人。

目前所在团队为合肥工业大学计算机与信息学院(人工智能学院)媒体计算实验室(Laboratory of Multimedia Computing, LMC)。欢迎了解和关注媒体计算实验室计算机视觉研究小组(小组主页:https://vut-hfut.github.io/),本团队研究方向包括模式识别与人工智能、计算机视觉理解与生成、多媒体分析与跨媒体推理等,团队常年招收和培养博士研究生、硕士研究生及本科生,欢迎志同道合的小伙伴们加入!(联系邮箱:tangsg@hfut.edu.cn,QQ:1028783685)


代表性成果:

论文:

[1] Dan Guo, Shengeng Tang, and Meng Wang, "Connectionist Temporal Modeling of Video and Language: a Joint Model for Translation and Sign Labeling", International Joint Conference on Artificial Intelligence (IJCAI), 2019: 751-757. [Link][PDF][BibTeX]

[2] Shengeng Tang, Dan Guo, Richang Hong, and Meng Wang, "Graph-Based Multimodal Sequential Embedding for Sign Language Translation", IEEE Transactions on Multimedia (TMM), 2022, 24: 4433-4445. [Link][PDF][BibTeX]

[3] Shengeng Tang, Richang Hong, Dan Guo, and Meng Wang, "Gloss Semantic-Enhanced Network with Online Back-Translation for Sign Language Production", ACM International Conference on Multimedia (ACM MM), 2022: 5630-5638. [Link][PDF][BibTeX]

[4] Peipei Song, Dan Guo, Xun Yang, Shengeng Tang, Erkun Yang, and Meng Wang, "Emotion-Prior Awareness Network for Emotional Video Captioning", ACM International Conference on Multimedia (ACM MM), 2023: 589-600. [Link][PDF][BibTeX]

[5] Peipei Song, Dan Guo, Xun Yang, Shengeng Tang, and Meng Wang, "Emotional Video Captioning with Vision-based Emotion Interpretation Network", IEEE Transactions on Image Processing (TIP), 2024, 33: 1122-1135. [Link][PDF][BibTeX]

[6] Shengeng Tang, Feng Xue, Jingjing Wu, Shuo Wang, and Richang Hong, "Gloss-driven Conditional Diffusion Models for Sign Language Production", ACM Transactions on Multimedia Computing, Communications, and Applications (TOMM), 2024. [Link][PDF][BibTeX]


著作:

[1] Dan Guo, Shengeng Tang, Richang Hong, and Meng Wang, "Sign Language Recognition", Multimedia for Accessible Human Computer Interfaces. Springer, Cham, 2021: 23-59. [Link][PDF][BibTeX]


专利:

[1] 郭丹; 唐申庚; 刘祥龙; 洪日昌; 汪萌; 一种基于图卷积的多模态融合手语识别系统及方法, 2023-3-14, 中国, ZL202010049714.7. (授权)

[2] 郭丹; 唐申庚; 刘祥龙; 汪萌; 一种基于多层次语义解析的手语翻译系统及方法, 2023-3-28, 中国, ZL202010103960.6. (授权)

[3] 郭丹; 谷纪豪; 唐申庚; 肖同欢; 曹晨曦; 宋万强; 一种基于深度智能交互的室外视障辅助方法, 2022-4-11, 中国, ZL202210371804.7. (授权)

[4] 郭丹; 曹晨曦; 肖同欢; 唐申庚; 谷纪豪; 黄滨; 一种基于语义分割的择优式方向偏移预警系统和方法, 2022-4-11, 中国, ZL202210374860.6. (授权)

[5] 郭丹; 刘泽宽; 郭义臣; 唐申庚; 武梓龙; 文则涵; 陈颖男; 一种基于深度学习的WiFi手语翻译系统及方法, 2022-7-8, 中国, CN202210805408.0. (实审)

[6] 唐申庚; 肖同欢; 郭丹; 谷纪豪; 曹晨曦; 宋万强; 黄滨; 一种基于图像目标检测和视觉深度估计的碰撞预警方法, 2023-2-27, 中国, CN202310188292.5. (实审)

[7] 唐申庚; 宋万强; 郭丹; 黄滨; 谷纪豪; 肖同欢; 曹晨曦; 一种基于带权无向图的视障人士路线规划方法, 2023-3-6, 中国, CN202310228006.3. (实审)


软著:

[1] 郭丹; 唐申庚; 陈颖男; 武梓龙; 文则涵; 刘泽宽; 基于关键点估计的人体姿态卡通化系统 V1.0, 2022SR0771364, 原始取得, 全部权利, 2022-06-16.

[2] 唐申庚; 黄滨; 郭丹; 谷纪豪; 盲人避障出行辅助系统 V1.0, 2023SR0517944, 原始取得, 全部权利, 2023-05-05.

[3] 唐申庚; 修雪玉; 郭丹; 董晓虎; 姚骏; 谢伟豪; 跨语言手语翻译系统 V1.0, 2023SR1107827, 原始取得, 全部权利, 2023-09-20.

  • 教育经历Education Background
  • 工作经历Work Experience
  • 研究方向Research Focus
  • 社会兼职Social Affiliations