Skip to content

Latest commit

 

History

History
31 lines (23 loc) · 2.99 KB

README_cn.md

File metadata and controls

31 lines (23 loc) · 2.99 KB

PyPI Python package codecov License Python Platform stars

算法 功能 场景 特点
fuzzy-hash 计算字符串、二进制、文件的 Hash 值,使相似的内容对应的 Hash 值也相似 快速检索相似文档、文件 适用于检测存在轻微变化的内容
LSH 把实数向量映射到 Hash 值,使相似的向量对应的 Hash 值也相似 O(N)时间内快速检索到top-k相似向量
min-hash 把集合映射到 Hash 值,使相似的集合对应的 Hash 值也相似 快速检索相似集合、检索相似文档 Hash 值相同的概率,等于 Jaccard 系数
SimHash 把文档(或者文档的特征例如TF-IDF)映射到 Hash 值,使相似的集合对应的 Hash 值也相似 快速检索相似文档
aHash 把图片映射到 Hash 值,使相似图片的 Hash 值也相似 相似图片检索 抗缩放、亮度攻击等
dHash 把图片映射到 Hash 值,使相似图片的 Hash 值也相似 相似图片检索 抗缩放、亮度攻击等
pHash 把图片映射到 Hash 值,使相似图片的 Hash 值也相似 相似图片检索 抗缩放、亮度攻击、平移、小部分内容改变