同源视频检索与商标货号识别的中期报告.docx
上传人:快乐****蜜蜂 上传时间:2024-09-15 格式:DOCX 页数:2 大小:10KB 金币:5 举报 版权申诉
预览加载中,请您耐心等待几秒...

同源视频检索与商标货号识别的中期报告.docx

同源视频检索与商标货号识别的中期报告.docx

预览

在线预览结束,喜欢就下载吧,查找使用更方便

5 金币

下载此文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

同源视频检索与商标货号识别的中期报告一、同源视频检索同源视频检索是指在视频数据库中,根据查询条件返回与查询视频类似的视频,需要解决两个核心问题,即视频特征提取与相似度计算。1.视频特征提取由于视频数据量庞大,直接用像素级别的数据进行相似度计算耗时且效果差,因此需要对视频进行特征提取。本项目选择了以下两种特征进行提取:①HOG特征采用HOG算法提取视频帧的特征,将每个帧分成多个小区域,对每个小区域进行梯度直方图统计,然后对所有小区域的直方图进行拼接得到该帧的特征向量,再将多个帧的特征向量平均,最终得到视频的特征向量。②神经网络特征采用预训练的深度神经网络中的全连接层作为特征提取器,输入每一帧图像并将其特征提取出来,再对所有帧的特征进行加权平均,最终得到视频的特征向量。2.相似度计算本项目采用余弦相似度作为相似度计算方法,即查询视频和数据库中视频的特征向量分别进行归一化处理后计算其余弦相似度,最终返回相似度最高的几个视频。二、商标货号识别商标货号识别是指从商品图片中识别出商标及货号的信息。本项目采用了以下两种方法进行实现:1.基于SVM模型的商标识别首先,对商标数据集进行处理,包括裁剪、预处理、特征提取等步骤,得到商标库,然后训练SVM分类器。当输入一个商品图片时,首先对图片进行目标检测,得到可能的商标候选框,并对候选框进行预处理、特征提取,然后用训练好的SVM分类器进行分类,最终得到识别结果。2.基于OCR模型的货号识别货号识别采用了基于CNN的OCR模型进行识别。首先,对货号数据集进行处理,包括数据增强、预处理等步骤,然后训练CNN网络,对货号图片进行识别。当输入一个商品图片时,首先对图片进行目标检测,得到可能的货号区域,然后对该区域进行预处理、特征提取,然后用训练好的CNN网络对文字进行识别,最终得到货号识别结果。以上是本项目的中期报告,欢迎批评指正。