视频搜索多样性重排序研究

更新时间:2019-12-03 来源:人工智能论文 点击:

【www.rjdtv.com--人工智能论文】

摘要


  多媒体网络技术的发展,促进了图像、视频采集设备的发展。从近年来的情况来看,储存费用有了明显的缩减,这一特点在 Web2.0 下尤为明显。各种视频门户网站,例如Facebook、YouTube、优酷网等,都开始上传大量的图片以及视频,并获得较多的受众。据不完全统计,全球每天需要上传的视频和图像数量超过百万,规模巨大。面对这些涌现到网络上的图像以及视频资源,使用传统的处理方式对其进行处理,已明显不能满足当前社会发展的需求,必须对其加以优化,下文将从视频收索方面入手,对视频的排序进行研究。
  
  1 多样性重排序研究
  
  和相关性排序有一些不同,多样性排序工作基本目标就是全面提升图像多样性,以此来避免出现信息冗余或者图像重复等问题。目前常见的形式是基于冗余移除以及聚类这两个方式。其中前者主要作用是处理视频搜索领域关键词查询二义性问题,和图像检测的实质比较接近。可以通过该技术将比较相似的图像从资料库当中检索出来,排列到检索结果当中。而后者的主要作用是对所有已搜索到的材料进行分类处理,从不同的材料当中挑选比较有代表性的图像,并将这些图像排列到结果前面,剩下的不达标图像排列在后面。
  
  在聚类方面,工作人员先通过图像来标注各种信息,计算不同图像之间主题覆盖关系,之后对主题覆盖关系进行处理,当成连接概率来看待。利用 PageRank 方法来计算不同图像和主题的丰富程度,最后按照顺序选择的方式来选取最丰富的内容,对不达标或者不相似的视频结果,予以返回处理。
  
  利用这种工作模式,将不准确的搜索结果返回到原始数据处,提升处理效率。目前多样性排序方法在使用的过程中,经常会受到限制。
  
  首先第一方面是因为绝大部分算法对相关性以及多样性不是同时优化,而是将不同的环节分开优化,所以优化结果的全局性比较差;其次是多样性评价准则并不精确,很容易影响到结果的准确性。
  
  2 应用领域
  
  将内容搜索排序技术当成应用空间比较广阔的一种技术,不仅可以将该技术应用到互联网搜索领域中,还可以将该技术应用到各种不同的大型视频数据库内容搜索中。工作人员可以启动自动语言识别技术,将语音识别作为基础,将其转化成文本信息,最终实现信息搜索,保证搜索结果的准确性,实现重排序。工作人员不但可以在图像、视频搜索领域使用该技术,还可以在其余的各个领域中使用该技术,取得良好的使用效果。比如视频摘要技术,其存在的主要目的就是对相同的搜索结果进行自动化分析、精简以及整合,按照逻辑关系对其进行排序,让视频搜索结果可以更加直观地呈现在用户面前,为用户提供最为准确、全面的视频信息,保证用户可以获到良好的视频搜索体验以及视频浏览体验等。通过重排序技术可以方便工作人员分析不同视频关联性以及重要性,为视频摘要整合、生成提供材料。除此之外,还可以通过使用搜索重排序技术的方式,将搜索重排序技术应用到协同推荐领域当中,通过该系统来为不同的用户提供不同个性化信息。如果在主题跟踪领域中应用,还可以利用该系统来为我国安全部门或者是商业机构提供一些专业化的图像视频信息、检测跟踪技术等。随着当前通讯技术和网络技术的日渐发展,互联网技术也日新月异,搜索重排序技术的日常应用范围必然会不断拓展,并显示出广阔的发展前景。
  
  2.1 相关性重排序
  
  重排序研究工作的主要内容,是针对系统搜索结果间相关性而建立的,是一种相关性的重排序。基本工作目的是要将返回的搜索结果,结合检索词分别从高到低进行排序,让用户可以在最短的时间内看到自己最希望看到的图像。该方面的研究比较广泛,目前主要研究方向集中在分类角度以及分类信息重新排序上,实现 Unsupervised Reranking 以及Supervised Reranking 排序。以无监督学习重排序为基础的一种平滑假设,是实用性比较高的一种平滑假设模式,可以通过该系统对样本进行处理,能够有效提升视觉相似度,而且搜索出的结果精确度也比较高。这种搜索模式比较侧重在原始搜索结果中,不断挖掘常规样本,并对原始搜索结果进行观察,发现与其相似的图像或者视频,将其当成搜索的基本样例原型使用。
  
  2.2 聚类技术的应用
  
  聚类是其中常用的方法之一。工作人员可以先利用聚类算法等,结合多模态特征,对相同级别的初始计算结果进行二次排序,提升结果查阅的便捷性。之后还可以利用不同模态下不同级别的类似内容来进行协同合作,找出相关性最高的查询结果。利用信息瓶颈理论(Information Bottleneck)对原始的搜索结果进行聚类,根据原始搜索的得分获得每个类的条件概率,概率大的类被看成是相关的原型,概率小的类被看成是原始搜索结果中的噪声,最后按照聚类的条件概率和图像的密度对初始查询结果排序。这种搜索模式操作难度比较低,但是操作的结果比较精确,所以被广泛使用到各种场所。
  
  3 发展趋势展望
  
  视频搜索未来发展趋势主要集中在以下三个方面。
  
  第一点是主动重排序模式,目前正在使用的重排序方式,基本没有工作人员参与到其中,所以也可以将其称为被动模式下的重排序技术。这种技术很难掌握不同用户的实际需求,而且从实际使用情况来看,如果被查询的词语含义比较模糊,则很难使用。为了让系统为用户提供更加优质的服务,提升用户的使用效率,近年来我国许多专家学者都在通过人机交互的方式来优化该技术,实现主动重排序,并被相关部门专家所关注。
  
  第二点是相关性重排序以及多样性重排序联合优化工作模式,这种模式当前正面临两个问题,问题集中在图像相关性重排序以及多样性重排序这两个方面。工作人员可以针对这两个方面的特点来提出相应的解决方式。不仅可以提升图像搜索速度,同时还可以让搜索的结果更加贴近查询的词语,提升检索准确性。
  
  第三点是半监督学习模式,半监督模式是目前最常见的一种模式,算法主要关注如何通过标注数据提供的信息来提升模型学习能力。与此同时,因为图像的重新排序问题较多,而且系统中还具有一定的平滑特性,所以虽然部分信息没有被标注,但是依然可以提供大量信息。
  
  4 结 语
  
  上文从内容的角度切入,分析了图像和视频的搜索重排序技术,并加以综述。从相关性重排序以及多样性重排序等方面,对问题进行介绍。当前最关键的研究点依然集中在相关性重排序方面,因为这一环节特色较为明显,并且还具有多样性特点。
  
  参考文献
  
  [1] 高瑞 . 百度、Google、Sogou 三种图像搜索引擎功能的比较 [J]. 中国科技信息 ,2010(18):91-92,108.
  
  [2] 张静 , 曲晓杰 , 冀中 , 苏育挺 . 基于内容的图像和视频搜索重排序技术综述 [J]. 计算机工程与应用 ,2011(29):171-174.
  
  [3] 周利民 , 童珉 , 陈燕双 . 面向互联网视频主题管理 的 搜 索 引 擎 关 键 技 术 研 究 及 实 现 [J]. 广 播 与 电 视 技术 ,2014(6):31-35.
  
  [4] 魏刃佳 , 吴振强 . 面向教育视频资源的垂直搜索引擎设计与实现 [J]. 计算机工程与应用 ,2014(15):113-116,135.

本文来源:http://www.rjdtv.com/jisuanjilunwen/2211.html