主要研究方向为机器视觉、机器学习、深度学习、模式识别。包括:
· 跨模态理解与推理(Cross-modal Understanding and Reasoning)
· 视听事件理解(Audio-Visual Event Understanding and Parsing)
· 视觉与自然语言(Image/Video Captioning and Explanation)
· 时序视频检测(Temporal Action Detection / Video Grounding)
· 视觉手语识别与翻译(Vison-based Sign Language Recognition and Translation)
· 视觉生理信号检测(Vision-based Physiological Measurement)
特色研究
· 视觉情感计算
· 视觉手语机器翻译
· 视频语义解析及定位
· 视觉聊天机器人