首页 » 博客 » 英特尔新 助力更快的矢量搜索

英特尔新 助力更快的矢量搜索

向量搜索在机构客户中越来越受欢迎,英特尔已做好准备,全力支持这一新兴行业。英特尔最新一代 CPU 在 Qdrant(一款用于企业 AI 应用的领先向量数据库)上表现出色。

英特尔刚刚发布了面向数据中心的最新至强处理器(代号:Emerald Rapids),预计数据中心市场规模将增长至 450 亿美元。Emerald Rapids 相较于前几代产品,提供更高性能的计算和显著的能效提升。与第四代 Sapphire Rapids 相比,Emerald 的 AI 推理性能提升高达 42%,向量搜索速度提升 38%。

矢量数据库操作的首选CPU

最新一代 CPU 在 Qdrant 研发部门开 电话号码库 展的测试中 快的矢量搜索 表现出色。英特尔 CPU 针对海量数据集进行了查询速度、数据库延迟和向量上传时间的压力测试。结果显示,32 核机器的查询速度比上一代产品提高了 1.38 倍。在此范围内,Qdrant 的延迟也比 Sapphire 降低了 2.79 倍。

Qdrant 强烈建议使用英特尔

核的下一代芯片。这种计算能力不仅 产品完善工艺 对于大多数云端机器来说是一个实用的核心数量,还能在大众市场用例中产生最佳效果。

CPU 通过影响数学计算的速度和效率来影响向量搜索。最近,一些公司开始使用 GPU 来承担 AI 模型训练和推理的大量工作负载。然而,研究表明,对于向量搜索而言,CPU 架构非常适合,因为它可以轻松处理并发请求。

向量搜索针对 CPU 进行了优化。英特尔的全新 CPU 带来了进一步的性能提升,使 AI 应用的向量运算速度飞快。客户应该考虑部署更多 CPU 而非 GPU 计算能力,以实现最佳性能并同时降低成本。

Qdrant 首席执行官 André Zayarni

为什么矢量搜索很重要?
qdrant CPU 英特尔基准测试报告

矢量搜索引擎使人工智能能够更深入地研究存储的数据并检索高度相关的响应。

Qdrant 的矢量数据库是现代信息检索和 比利时商业指南 机器学习系统的关键。那些希望运行大规模检索增强生成 (RAG) 解决方案的人需要利用此类语义搜索引擎,以便通过其 AI 产品生成最佳结果。

专为帮助开发者高效存

储和搜索高维向量而设计。它可以轻松与众多 AI/ML 工具集成,包括大型语言模型 (LLM)、LangChain、LlamaIndex 或 Haystack 等框架,以及 Cohere、OpenAI 和 Ollama 等服务提供商。

支持企业级 AI/ML

市场正在为大量人工智能和机器学习案例做准备,将 快的矢量搜索 计算推向创新竞赛的前沿。

像 Qdrant 这样的向量数据库的主要优势在于,它能够持续支持用户,即使经历了原型设计和发布阶段也依然如此。Qdrant 的产品已被拥有数十亿数据点的大型企业所采用。这些用户几乎可以立即从测试阶段过渡到生产阶段。对于那些希望托管大型应用程序的用户来说,可能只需要高达 18GB 的​​内存即可支持 100 万个 OpenAI 向量。这使得 Qdrant 成为最大化资源利用率和数据连接的最佳选择。

英特尔的最新进展对矢量数据库的未来至关重要。矢量搜索操作非常耗费 CPU 资源。因此,Qdrant 依靠英特尔等芯片制造商的创新来提供大规模支持。

矢量数据库是当今 AI/ML 工具链的

支柱,为最新一代 RAG 和其他 Gen AI 应用提供支持。通过与 Qdrant 合作,英特尔将利用 Qdrant 在基于最新英特尔架构的基础架构上跨部署模型运行的高性能、高性价比矢量相似性搜索功能,帮助企业提供尖端的 Gen-AI 解决方案,并最大化其投资回报率。

Arijit Bandyopadhyay,英特尔公司 CSV 集团企业分析与人工智能首席技术官、云与企业战略主管
推进矢量搜索和下一代 CPU 的作用
展望未来,矢量数据库市场正处于显著增长的阶段,尤其是在企业市场。英特尔等公司的 CPU 技术发展预计将通过以下方式增强矢量搜索操作:1)提高处理速度;2)提升检索效率和质量。这将使企业用户能够轻松管理更庞大、更复杂的数据集,并在全球范围内引入人工智能。

随着大型公司不断整合复杂

的人工智能和机器学习工具,对强大矢量数据库的依赖将会日益增加。市场的这种演变凸显了持续硬件创新对于满足数据密集型应用日益增长的需求的重要性,而英特尔的贡献在塑造企业级人工智能/机器学习解决方案的未来方面发挥着显著作用。

滚动至顶部