该项目实现了一个模型上下文协议(MCP)服务器,可实现对Pinecone向量数据库的读写操作。它能有效处理PDF数据以及Confluence数据,为相关数据处理提供了便捷的解决方案。
本项目实现的MCP服务器允许对Pinecone向量数据库进行读写操作。下面为你介绍快速启动项目的步骤。
bun install
.env
文件,内容如下:PINECONE_API_KEY=你的Pinecone API密钥
OPENAI_API_KEY=你的OpenAI API密钥
PINECONE_HOST=你的Pinecone主机地址
PINECONE_INDEX_NAME=你的索引名称
DEFAULT_NAMESPACE=默认命名空间
启动服务器:
bun src/index.ts
服务器将启动并监听stdio上的MCP命令。
使用示例客户端测试服务器:
bun examples/client.ts
Confluence处理脚本提供详细的日志记录和验证:
bun src/scripts/process-confluence.ts <文件路径> [集合] [范围]
参数说明:
文件路径
:指向你的Confluence JSON文件(必填)。集合
:文档集合名称(默认为"documentation")。范围
:文档范围(默认为"documentation")。示例:
bun src/scripts/process-confluence.ts ./data/confluence-export.json "tech-docs" "engineering"
脚本将执行以下操作:
服务器提供了以下工具,可根据不同需求灵活使用:
search-vectors
- 使用文本查询搜索相似文档,参数包括:
add-vector
- 添加单个文档,参数包括:
process-confluence
- 处理Confluence JSON数据,参数包括:
delete-vectors
- 删除向量,参数包括:
get-stats
- 获取数据库统计信息(暂不可用)。服务器需要Pinecone向量数据库。在.env
文件中配置连接参数:
PINECONE_API_KEY=你的API密钥
PINECONE_HOST=你的主机地址
PINECONE_INDEX_NAME=你的索引名称
DEFAULT_NAMESPACE=默认命名空间
ID: confluence-[page-id]-[item-id]
title: [标题]
pageId: [页面ID]
spaceKey: [空间键]
type: [类型]
content: [文本内容]
author: [作者姓名]
source: [来源]