0

0

DeepSeek API如何配合向量数据库使用_将文本向量化后存入Milvus再进行检索

P粉602998670

P粉602998670

发布时间:2026-01-14 13:36:02

|

755人浏览过

|

来源于php中文网

原创

需完成向量获取、维度对齐、集合创建、数据写入与查询调用:一、配置DeepSeek API获取文本嵌入向量;二、启动Milvus并验证连接;三、创建匹配维度的集合;四、批量插入向量及元数据;五、执行相似性搜索。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

deepseek api如何配合向量数据库使用_将文本向量化后存入milvus再进行检索

如果您使用DeepSeek API生成文本向量,并希望将这些向量持久化存储至Milvus以支持高效相似性检索,则需完成向量获取、维度对齐、集合创建、数据写入与查询调用等关键环节。以下是实现该流程的具体操作路径:

一、配置DeepSeek API并获取文本嵌入向量

该步骤旨在通过DeepSeek提供的嵌入接口,将原始文本转换为固定维度的稠密向量。需确保API服务可用、认证凭证正确,且返回向量格式符合Milvus字段定义要求。

1、在终端中设置环境变量export OPENAI_API_KEY='your_deepseek_api_key'

2、调用本地或远程DeepSeek嵌入服务(如Ollama托管的deepseek-r1模型):

3、向http://localhost:11434/api/embeddings发送POST请求,携带{"model":"deepseek-r1:1.5b","input":"待向量化的文本"}参数

4、解析响应体,提取embedding字段值,确认其为长度一致的浮点数列表(例如768维)

二、启动Milvus服务并验证连接可用性

此步骤确保Milvus实例处于运行状态,客户端可通过gRPC或HTTP协议与其通信。若使用Docker部署,需检查容器健康状态及端口映射是否生效。

1、执行docker ps | grep milvus,确认milvus-standalone容器正在运行

2、访问http://localhost:19530/healthz,返回{"status":"healthy"}表示服务就绪

3、在Python环境中安装Milvus SDK:pip install pymilvus==2.4.10

4、使用pymilvus connections.connect("default", host="localhost", port="19530")建立连接

三、创建匹配维度的Milvus集合

集合(Collection)是Milvus中向量数据的逻辑容器,其schema必须与DeepSeek输出向量维度严格一致;否则插入或查询将失败。

1、定义字段:包含主键id(int64)、向量字段vector(float_vector)、可选元数据字段如text(varchar)

2、设定向量维度参数:dim参数必须等于DeepSeek嵌入向量的实际长度(如768)

NeuralText
NeuralText

Neural Text是一个使用机器学习自动生成文本的平台

下载

3、执行Collection.create()方法创建集合,例如命名为deepseek_docs

4、为向量字段构建索引,推荐初始配置:{"index_type": "IVF_FLAT", "metric_type": "COSINE", "params": {"nlist": 128}}

四、批量插入DeepSeek生成的向量及关联元数据

该步骤将文本内容、唯一标识符与对应向量三元组封装为结构化记录,导入Milvus集合。需注意批次大小控制以避免内存溢出或超时。

1、组织数据列表:entities = [ids, vectors, texts],其中vectors为二维列表,每行对应一个向量

2、调用collection.insert(entities)提交数据,返回插入结果对象

3、执行collection.flush()强制落盘,确保数据立即可查

4、验证插入数量:collection.num_entities应与预期条数一致

五、基于新查询文本执行向量相似性搜索

检索阶段复用相同DeepSeek嵌入流程,将用户输入转化为向量后,在Milvus中执行近似最近邻(ANN)查找,返回Top-K最相似记录。

1、对查询文本调用DeepSeek嵌入接口,获取单条向量query_vector

2、构造搜索参数:search_params = {"metric_type": "COSINE", "params": {"nprobe": 10}}

3、执行collection.search([query_vector], "vector", search_params, limit=5, output_fields=["text"])

4、遍历results[0],提取每个命中项的entity.textdistance字段

相关专题

更多
python开发工具
python开发工具

php中文网为大家提供各种python开发工具,好的开发工具,可帮助开发者攻克编程学习中的基础障碍,理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容,供大家免费下载使用。

751

2023.06.15

python打包成可执行文件
python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章,大家可以免费的下载体验。

636

2023.07.20

python能做什么
python能做什么

python能做的有:可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

758

2023.07.25

format在python中的用法
format在python中的用法

Python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

618

2023.07.31

python教程
python教程

Python已成为一门网红语言,即使是在非编程开发者当中,也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章,大家可以免费体验学习。

1262

2023.08.03

python环境变量的配置
python环境变量的配置

Python是一种流行的编程语言,被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后,我们需要配置环境变量,以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

547

2023.08.04

python eval
python eval

eval函数是Python中一个非常强大的函数,它可以将字符串作为Python代码进行执行,实现动态编程的效果。然而,由于其潜在的安全风险和性能问题,需要谨慎使用。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

577

2023.08.04

scratch和python区别
scratch和python区别

scratch和python的区别:1、scratch是一种专为初学者设计的图形化编程语言,python是一种文本编程语言;2、scratch使用的是基于积木的编程语法,python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容,供大家免费下载体验。

706

2023.08.11

Java 桌面应用开发(JavaFX 实战)
Java 桌面应用开发(JavaFX 实战)

本专题系统讲解 Java 在桌面应用开发领域的实战应用,重点围绕 JavaFX 框架,涵盖界面布局、控件使用、事件处理、FXML、样式美化(CSS)、多线程与UI响应优化,以及桌面应用的打包与发布。通过完整示例项目,帮助学习者掌握 使用 Java 构建现代化、跨平台桌面应用程序的核心能力。

2

2026.01.14

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 0.6万人学习

Django 教程
Django 教程

共28课时 | 3.1万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号