个人信息Personal Information
副教授
硕士生导师
教师拼音名称:huitianrui
电子邮箱:
所在单位:智能科学与技术系
学历:博士研究生毕业
性别:男
学位:工学博士学位
在职信息:在职
毕业院校:中国科学院信息工程研究所
研究方向
图像视频分割
图像视频分割是计算机视觉中的一个重要研究领域,其主要目标是从图像或视频中区分出不同的区域或者对象,并为每个像素分配一个标签。这些标签可以表示不同的物体、背景或者是特定的区域。图像视频分割技术广泛应用于多个领域,如自动驾驶、医学影像分析、安全监控、虚拟现实等。
具体来说,图像视频分割可以分为以下几个方面:
1. 语义分割:为输入图像中的每一个像素点赋予一个类别标签。这意味着整个图像被分成若干个部分,每个部分属于一个特定的类别,例如道路、汽车、行人等。
2. 实例分割:不仅识别图像中每个像素所属的类别,还能够区分同一类别下的不同个体。例如,在一张包含多个人的照片中,实例分割能够分别标记出每个人。
3. 全景分割:结合了语义分割和实例分割的优点,对图像中的每个像素进行分类的同时,还能识别出不同对象的边界以及它们之间的关系。
4. 视频分割:在连续的视频帧之间保持一致性的分割任务。视频分割需要处理帧间的时间一致性,以确保相邻帧中的相同物体具有相同的标签。
5. 运动分割:专注于分析视频中物体的运动情况,将具有相似运动特性的像素归为一类,例如将背景与前景移动物体分开。
图像视频分割面临的挑战包括但不限于:复杂的背景环境、目标尺度的变化、遮挡问题、光照变化、视角变化等。近年来,随着深度学习的发展,尤其是卷积神经网络(CNN)及其变种的引入,图像视频分割技术取得了显著的进步。深度学习模型能够自动学习到图像中的特征表示,并且在大规模数据集上训练后能够实现较为精确的分割效果。