微软Bing团队宣布开源搜索关键算法——SPTAG。遵守MIT开源协议。SPTAG (Space Partition Tree And Graph)是分布式近似最近邻域搜索(ANN)库,为大规模矢量搜索场景提供高质量矢量索引构建、搜索和分布式在线服务工具包。SPTAG做为Bing搜索的底层人工智能技术之一,能够在几毫秒内搜索数十亿条信息。SPTAG库基于 C++ 编写并以Python打包。

微软表示“通过Bing搜索,矢量化工作已经扩展到搜索引擎索引的超过1500亿条数据,从而带来了对传统关键字匹配的改进。” “这些包括单个单词,字符,网页摘要,完整查询和其他媒体。一旦用户搜索,Bing就可以扫描索引的向量并提供最佳匹配。“ Bing 团队期望开源 SPTAG 后,更多运用于企业或面向消费者的应用,构建可识别基于音频片段所说语言的应用,例如让用户拍摄植物照片并识别属和物种的服务。

GitHub 仓库挂件 WordPress 插件

microsoft / SPTAG

A distributed approximate nearest neighborhood search (ANN) library which provides a high quality vector index build, search and distributed online serving toolkits for large scale vector search scenario.

 

文件下载