大道至简:极智嘉联合马来西亚大学、英国Surrey大学提出全新数据哈希检索算法

2021-11-25 09:45

传统算法在欧式空间将数据变换到哈希空间,之后进行数据间的比较或进行哈希化,为此需要使用不同的损失函数来组合评价。与此相比,新算法以余弦相似度为基础提出一种全新的优化方案,仅使用一种损失函数进行评价,同时不要求特殊网络设计与训练技巧,以一种大道至简的方式实现。具体来说,本算法将原始数据通过特征变换,重新在单位化的欧氏空间进行余弦相似度比较。通过利用余弦相似度打通了哈希空间与欧氏空间的联系。


如下面公式所示,左侧为哈希空间表示了数据点在哈希空间的相似度,公式右侧为相同数据点在单位化后的欧氏空间的余弦相似度。因此,该算法可以直接通过在欧式空间的操作完成数据在哈希空间的转换与比较,清晰的反应了数据在变换后哈希空间的情况,并且对计算机在欧式空间的计算更加有利。因此,极大的优化了计算效力与检索精度,化繁为简。


1.jpg

新算法的分类显著性可由图2所示。左侧为直接基于欧式空间的优化模型,中间及右侧为论文提出方案。可以看出在使用余弦相似度评估之后,类比之间的差异被放大,并且在新空间内具备方向性。

1.jpg

▲图2 交叉熵与余弦相似度的特征分离程度比较


10秒快速发布需求

让物流专家来找您