惠天瑞

个人信息Personal Information

副教授

硕士生导师

教师拼音名称:huitianrui

电子邮箱:

所在单位:智能科学与技术系

学历:博士研究生毕业

性别:男

学位:工学博士学位

在职信息:在职

毕业院校:中国科学院信息工程研究所

研究方向

当前位置: 中文主页 >> 研究方向

图像视频分割

图像视频分割是计算机视觉中的一个重要研究领域,其主要目标是从图像或视频中区分出不同的区域或者对象,并为每个像素分配一个标签。这些标签可以表示不同的物体、背景或者是特定的区域。图像视频分割技术广泛应用于多个领域,如自动驾驶、医学影像分析、安全监控、虚拟现实等。


具体来说,图像视频分割可以分为以下几个方面:


1. 语义分割:为输入图像中的每一个像素点赋予一个类别标签。这意味着整个图像被分成若干个部分,每个部分属于一个特定的类别,例如道路、汽车、行人等。


2. 实例分割:不仅识别图像中每个像素所属的类别,还能够区分同一类别下的不同个体。例如,在一张包含多个人的照片中,实例分割能够分别标记出每个人。


3. 全景分割:结合了语义分割和实例分割的优点,对图像中的每个像素进行分类的同时,还能识别出不同对象的边界以及它们之间的关系。


4. 视频分割:在连续的视频帧之间保持一致性的分割任务。视频分割需要处理帧间的时间一致性,以确保相邻帧中的相同物体具有相同的标签。


5. 运动分割:专注于分析视频中物体的运动情况,将具有相似运动特性的像素归为一类,例如将背景与前景移动物体分开。


图像视频分割面临的挑战包括但不限于:复杂的背景环境、目标尺度的变化、遮挡问题、光照变化、视角变化等。近年来,随着深度学习的发展,尤其是卷积神经网络(CNN)及其变种的引入,图像视频分割技术取得了显著的进步。深度学习模型能够自动学习到图像中的特征表示,并且在大规模数据集上训练后能够实现较为精确的分割效果。