惠天瑞

个人信息Personal Information

副教授

硕士生导师

教师拼音名称：huitianrui

电子邮箱：

所在单位：智能科学与技术系

学历：博士研究生毕业

性别：男

学位：工学博士学位

在职信息：在职

毕业院校：中国科学院信息工程研究所

研究方向

当前位置: 中文主页 >> 研究方向

图像视频分割

图像视频分割是计算机视觉中的一个重要研究领域，其主要目标是从图像或视频中区分出不同的区域或者对象，并为每个像素分配一个标签。这些标签可以表示不同的物体、背景或者是特定的区域。图像视频分割技术广泛应用于多个领域，如自动驾驶、医学影像分析、安全监控、虚拟现实等。

具体来说，图像视频分割可以分为以下几个方面：

1. 语义分割：为输入图像中的每一个像素点赋予一个类别标签。这意味着整个图像被分成若干个部分，每个部分属于一个特定的类别，例如道路、汽车、行人等。

2. 实例分割：不仅识别图像中每个像素所属的类别，还能够区分同一类别下的不同个体。例如，在一张包含多个人的照片中，实例分割能够分别标记出每个人。

3. 全景分割：结合了语义分割和实例分割的优点，对图像中的每个像素进行分类的同时，还能识别出不同对象的边界以及它们之间的关系。

4. 视频分割：在连续的视频帧之间保持一致性的分割任务。视频分割需要处理帧间的时间一致性，以确保相邻帧中的相同物体具有相同的标签。

5. 运动分割：专注于分析视频中物体的运动情况，将具有相似运动特性的像素归为一类，例如将背景与前景移动物体分开。

图像视频分割面临的挑战包括但不限于：复杂的背景环境、目标尺度的变化、遮挡问题、光照变化、视角变化等。近年来，随着深度学习的发展，尤其是卷积神经网络（CNN）及其变种的引入，图像视频分割技术取得了显著的进步。深度学习模型能够自动学习到图像中的特征表示，并且在大规模数据集上训练后能够实现较为精确的分割效果。