所属领域: A 电子信息技术
技术成果简介
当今,图像及视频数据呈爆炸式增长,面对纷繁复杂的多媒体数据,如何有效的分析并理解其语义内容变得日趋重要。为了解决以上问题,计算机视觉识别技术便孕育而生。目前,在该领域内随着大规模视觉数据库的建立以及深度神经网络的广泛应用,视觉识别方法得到了迅速的发展,特别在视觉特征提取、强监督模型构建、数据驱动神经网络学习方面取得了较大的进步。然而,由于底层视觉数据与中高层语义信息间固有的语义鸿沟,当前对象识别算法在判别性特征提取、少量及零样本识别、跨特征域适应性等关键问题上仍进展缓慢。针对现有技术中的上述不足,本发明提供一种基于判别性视觉属性的零样本识别方法及系统,方法包括以下步骤:S1:构建稀疏编码模型,基于原特征域样本数据优化稀疏编码模型得到视觉特征到人工定义属性表示的原特征域变换关系;S2:引入分类错误代价项构建监督字典学习目标模型,提取原特征域判别性视觉属性集合;S3:基于原特征域变换关系及原特征域判别性视觉属性集合,构建目标特征域学习模型,挖掘目标特征域判别性视觉属性;S4:输入包含语义对象的待测图像,通过深度残差网络提取待测图像的深度视觉特征,并优化稀疏编码目标函数,得到待测图像视觉特征的语义属性表示。本发明能解决人工定义属性在识别时导致特征表示语义信息的匮乏问题,增强视觉特征表示的判别能力。
技术成果前景
(1)、本发明挖掘不同对象类别的判别性视觉属性,并引入于语义嵌入空间,通过优化字典学习模型目标函数,实现视觉特征空间与语义嵌入空间的联合,最终有效增强了视觉特征表示的判别能力;(2)、本发明将基于零样本的视觉识别问题分解为原特征域学习及目标特征域学习两个部分,并通过正则化约束建立了相互的关联,保证了知识迁移过程中的特征域适应性,有效提高了跨特征域情况下对象识别的性能。