京东零售虽迟但到,2018年初,构建起十亿规模的实时分布式图片搜索系统,向量数据库Vearch问世。出生之时便是“劳模”体质,很多活等着它去干:
解决重复铺货,商城APP同款推荐,商品详情页去重等等。
放眼全球,向量数据库这事儿不是中国两家头部电商最先做的。
而是美国硅谷那家叫做Meta(脸书)的公司。该公司的人工智能基础研究小组(Fundamental AI Research Group)向全世界开源了FAISS(全称为Facebook AI Similarity Search)。
极客们认为,FAISS本身是很棒的算法,是向量数据库界的“风清扬”前辈。
向量数据库的本质是什么?
向量数据库的本质不是数据库。
而是大数据系统中的向量检索功能把这个功能集成在数据库上也就成了向量数据库。
向量检索功能的背后,是向量相似度检索这个能力。
把数据以向量的形式存到一个数据库里,用向量相似度匹配的方式查找出来。
市面上有很多数据库产品都能做相似的事情,都能扩展出类似的能力。$腾讯控股(00700)$![拍立淘的背后,是一款向量检索引](https://xqimg.imedao.com/18943cd6d3159bf73fe3263f.jpg!800.jpg)
![拍立淘的背后,是一款向量检索引](https://xqimg.imedao.com/18943cd73cd59bfa3fe6bd94.jpg!800.jpg)