合肥工业大学主页平台管理系统陈雁翔--中文主页--科学研究

当前位置: 中文主页 >> 科学研究

研究领域

研究领域主要包括：多媒体信息处理、多媒体安全及伪造检测、音视频多模态信息处理、人工智能

实验室科研经费充足，凡参与项目的学生均提供助研津贴，团队管理人性化，与多个国内外研究机构建立了良好的合作关系，欢迎对音视频信息处理、多媒体安全、深度学习等感兴趣的同学联系创新创业项目、实习以及报考研究生。

主持的项目有：

国家自然科学基金面上项目：视听觉多对齐机制下跨模态生成方法研究（61972127）

国家自然科学基金面上项目：基于音视频关联的交叉感知驱动选择性注意机制研究（61672201）

国家自然科学青年基金：具有情感的可视语音中基于耦合关系的音视频关联方法的研究（61105076）

安徽省重点研发计划国际科技合作专项：基于传感器融合的地铁轮轨故障诊断与振动影响研究（202104b11020013）

安徽省科技攻关重大专项：“畅行”交通云服务关键技术与系统研发（15czz02074）

安徽省自然科学基金：基于视频检测跟踪的异常车辆警务联动控制方法的研究（1408085MKL76）

安徽省自然科学基金：可视语音中基于发音特征的音视频关联模型的研究（11040606M127）

安徽省科技攻关语音产业创新专项：具备友好互动能力的情感感知和情感自然表达关键技术与系统（11010202192）

第51批中国博士后科学基金面上资助：智能人机语音交互中基于文本与语音的情感融合研究（2012M511402）

企业委托项目：智能交通驾驶员安全带检测系统、智能交通驾驶员行为分析预警系统、个性化语音合成系统等。

教育部产学合作协同育人：融合视觉信息的多模态语音信号处理研究（201901296001）

中央某部委项目：面向XXX真伪识别技术

合肥市科技攻关“揭榜挂帅”人工智能领域项目：知识数据双驱动下的水利大模型关联推理与检索增强关键技术研发

参与的项目有：

“863”国家高技术研究发展计划资助项目：中文情感语义计算技术与系统（2012AA011103），

国家973预研项目：普适个性化信息处理基础理论和方法研究（2009CB326203）。

授权发明专利有：

Method, System and Electronic Device for Processing Audio-Visual Data(美国专利)，US17038311

一种面向水利大模型检索增强的文档表格结构识别方法，ZL202511128539.X

无需重放的域增量音频伪造检测方法、装置、设备和介质，ZL202411005772.4

基于谱体积的自然场景生成视频检测方法和系统，ZL202411576739.7

音视频数据处理方法、系统、电子设备及存储介质，ZL202010257755.5

基于韵律特征参数和情感参数关联性的语音情感修正方法，ZL201310100284.7；

一种基于属性空间的人脸可视化特征表征方法，ZL201310192441.1；

一种驾驶员多种行为预警系统及危险评估方法，ZL201510054227.9;

一种基于Adaboost的安全带检测方法，ZL201410174018.3;

一种基于声谱图显著性检测的音频识别方法，ZL201510054228.3。

主要代表性论文：

[1] Zhiyuan Wang, Yanxiang Chen*, Yuanzhi Yao, Yunfeng Diao. “Precise Temporal Forgery Localization via Quantified Audio–Visual Asynchrony”, IEEE Transactions On Information Forensice and Security (TIFS)（多媒体内容安全领域顶级期刊）, 21: 3900-3914，2026.

[2] Zhiyuan Wang, Yanxiang Chen*, Yuanzhi Yao, Meng Han, Wenpeng Xing, Meng Li. “IDCNet: Image Decomposition and Cross-view Distillation for Generalizable Deepfake Detection”, IEEE Transactions On Information Forensice and Security (TIFS)（多媒体内容安全领域顶级期刊）, 20: 8373-8386，2025.

[3] Pengcheng Zhao, Jinxing Zhou, Yang Zhao, Dan Guo*, Yanxiang Chen*. Multi-modal Class-aware Semantic Enhancement Network for Audio-Visual Video Parsing. in Proc. of the 39th AAAI Conference on Artificial Intelligence (AAAI)（人工智能领域顶级会议）, Philadelphia, USA, 2025.

[4] Pengcheng Zhao, Yanxiang Chen*, Dan Guo, Yuanzhi Yao. Text-infused Audio-visual Video Parsing with Semantic-aware Multimodal Contrastive Learning, in Proc. of IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)（语音信号处理领域顶级会议）, Hyderabad, India, 2025.

[5] Yanxiang Chen*, Pengcheng Zhao, Meibin Qi, Yang Zhao, Wei Jia, and Ronggang Wang ,“Audio Matters in Video Super-Resolution by the Implicit Semantic Guidance”, IEEE Transactions On Multimedia (TMM)（多媒体领域顶级期刊）, 24: 4128-4142, 2022.

[6] Fan Li, Yanxiang Chen*, Haiyang Liu, Zuxing Zhao, Yuanzhi Yao, Xin Liao. “Vocoder Detection of Spoofing Speech Based on GAN Fingerprints and Domain Generalization”, ACM Transactions on Multimedia Computing, Communications, and Applications (TOMM)（人工智能领域著名期刊）, 20(6): 1-20, 2024.

[7] Yupeng Zhu, Yanxiang Chen*, Zuxing Zhao, Xueliang Liu, Jinlin Guo. “Local Self-attention-based Hybrid Multiple Instance Learning for Partial Spoof Speech Detection”, ACM Transactions on Intelligent System Technology(TIST)（人工智能领域著名期刊）, 14(5): 93:1-93:18, 2023.

[8] Yanxiang Chen*, Tam V. Nguyen, Mohan Kankanhalli, Shuicheng Yan, Meng Wang, “Audio Matters in Visual Attention”, IEEE Transactions On Circuits and Systems for Video Technology (TCSVT)（视频处理领域顶级期刊）, 24(11): 1992-2003, 2014.

陈雁翔 (教授)

研究领域

论文成果

专利成果

著作成果

科研项目