为企业提供先进的视觉搜索解决方案,并将自己定位为企业数据的“谷歌镜头”。他们的技术支持各种用例,例如在大型零售商和机械制造公司网站上进行视觉搜索,这些用例需要对备件进行视觉识别。其主要目标是尽快识别产品目录中的商品或备件。凭借强大的电商基础和近十年的矢量搜索经验,Nyris 始终处于视觉搜索创新的前沿。
除了视觉搜索,Nyris 还提供合成数据解决方案,尤其面向 觉搜索的未来 制造业和工程行业。这些行业的客户通常缺乏足够的零件照片,无法有效地利用视觉搜索。然而,他们拥有产品的 CAD 文件。Nyris 可以根据这些 CAD 文件生成合成图像,从而无需数据库中存储实际产品照片即可进行视觉搜索。
宜家、Trumpf(精密激光制造商)和 DMG Mori 等知名客户依靠 Nyris 支持其现场工程师维护零件。
克服视觉产品搜索的局限性
在亚马逊工作期间,卢卡森观察到,像谷歌 购买电话号码列表 这样的搜索引擎在产品搜索方面的表现往往优于亚马逊的搜索能力。他意识到电子商务和备件管理等行业需要更精准的搜索解决方案,并发现了一个显著的差距:传统的基于关键词的搜索经常失效,尤其是在现场工程师难以用关键词准确描述零件的情况下。视觉搜索提供了一种解决方案,它利用图像提供更快、更准确的结果,图像比基于文本的查询包含的信息量要多得多。
在寻求完美的视觉搜索提供商的过程中,Nyris 最终决定开发自己的解决方案。
基于矢量的视觉搜索之路
2015年,团队最初探索了基于键值SIFT(尺度不变特征变换)的传统搜索算法,用于定位图像中的特定元素。然而,他们很快意识到这些方法既不精确,又不可靠。为了解决这个问题,Nyris 开始尝试使用首个卷积神经网络 (CNN) 来提取向量搜索的嵌入向量。
在向量搜索的早期,可用的解决方 她总是在寻找 案寥寥无几。Nyris 最初开发了自己的向量搜索解决方案,但后来过渡到 SingleStore。当时,SingleStore 是唯一能够提供高效、快速、大规模 觉搜索的未来 暴力向量搜索的解决方案。随着 Nyris 数据的增长,快速扩展的需求变得愈发明显。他们发现,许多标准的数据库功能(例如实时分析和原子性)对于他们的特定需求而言并无必要。相反,Nyris 需要的是一个专注于快速高效的向量搜索功能的解决方案,以及能够提升客户搜索体验的功能。
随着纯粹的原生矢量搜索引擎 比利时商业指南 的出现,Nyris 进行了广泛的研究和基准测试。最终,他们选择了 Qdrant 作为其首选矢量搜索引擎。Qdrant 以其准确性、速度和高效处理大型数据集的能力脱颖而出,满足了 Nyris 对强大且可扩展的矢量搜索解决方案的所有要求。
选择过程 作为选择过程的一部分
Nyris 评估了几个关键因素,以确保他们选择最佳的矢量搜索引擎解决方案:
准确性和速度:这些是主要考虑因素。Nyris 需要了解基于HNSW图的方法与暴力搜索之间的性能差异。特别是,他们研究了一些需要大量筛选条件的极端情况,有时甚至需要切换到暴力搜索。即使在这些情况下,Qdrant 也展现出令人印象深刻的速度和可靠性,满足了 Nyris 严格的性能要求。
插入速度:Nyris 评估了数据插入数据库的速度,包括同时进行数据提取和查询请求时的性能。Qdrant 在这方面表现出色,为其运营提供了必要的效率。
总体拥有成本:Nyris 分析了每种解决方案相关的基础设施成本和许可费用。Qdrant 提供了极具竞争力的总体拥有成本,使其成为经济可行的选择。
数据主权:在自己的集群中部署 Qdrant 的能力是 Nyris 的一个关键方面,确保他们保持对数据的控制并遵守相关的数据主权要求。
专用矢量搜索引
正如 Lukasson 所强调的,Qdrant 的一大关键优势 觉搜索的未来 在于它作为专用的原生矢量搜索引擎的专业化。“Qdrant 专为矢量搜索而构建,可以更快地引入相关功能,例如量化、8 位整数支持和 32 位浮点数重新评分。这些改进使搜索更加精准、经济高效,同时又不牺牲准确性——这正是 Nyris 所需要的,”Lukasson 说道。“在优化搜索准确性和速度时,绝不妥协。正如你不会用卡车参加一级方程式赛车一样,我们需要一个专为矢量搜索设计的解决方案,而不仅仅是一个附加矢量搜索功能的通用数据库。随着 Qdrant 的每次发布,我们都会获得新的定制功能,这些功能可以直接增强我们的用例。”
Qdrant 在生产中的主要优势
Nyris 发现 Qdrant 的几个方面在其生产环境中特别有益:
使用 JWT 增强安全性:JSON Web 令牌提供增强的安全性和性能,这对于保护其数据至关重要。
无缝可扩展性:Qdrant 能够轻松地跨节点扩展,即使 Nyris 的数据量不断增长,也能确保始终如一的高性能。
灵活的搜索选项:基于图形和强力搜索方法的可用性为 Nyris 提供了灵活性,可以根据特定的用例要求定制搜索方法。
多功能数据处理:Qdrant 对数据类型和向量大小几乎没有任何限制,允许 Nyris 有效地管理多样化和复杂的数据集。
使用 Rust 构建:使用Rust可确保卓越的性能和面向未来性,而其开源特性允许 Nyris 根据需要检查和定制代码。
经济高效的高性能搜索:Qdrant 高效的搜索功能确保 Nyris 能够以合理的成本保持高性能。借助 Qdrant,Nyris 能够高效地搜索海量数据集,使其成为其技术堆栈的重要组成部分。
通过在其 Kubernetes 集群中的 Google Cloud 上托管 Qdrant,Nyris 受益于其苛刻的操作所必需的可扩展性和可靠性,确保了强大而高效的视觉搜索解决方案。
为什么纯向量搜索是产品搜索的未来
Nyris 的愿景是在几毫秒内识别出每一个产品和备件,而 Qdrant 在其中扮演着不可或缺的角色。展望产品搜索的未来,Lukasson 坚信矢量表示将是提升搜索能力的关键。与关键词搜索不同,矢量搜索可以无缝集成各种模态,例如文本、图像以及深度或音频。这种整体方法将彻底改变产品和备件搜索,实现单一矢量表示,涵盖产品的文本、视觉和几何描述。
“虽然像 BM25 这样的传统算法速度快、成本低,在搜索领域仍然占有一席之地,但向量搜索将在未来几年取代它们,”Lukasson 说道。“目前,文本搜索、视觉搜索和其他搜索方式各有不同,但我们设想未来将有一个统一的向量表示,涵盖所有相关的商品数据。无论您使用什么输入进行查询,搜索结果都将是准确的。滚动浏览数千条结果或遇到“无结果”页面的日子即将结束。每个搜索请求都将在几毫秒内提供正确的产品或备件。”