Daizo Mcp

Daizo Mcp

🚀 daizo-mcp

daizo-mcp 是一个 MCP(模型上下文协议)服务器,它能让 AI 助手直接访问包含 CBETA、巴利三藏(Pāli Tipitaka)和 SAT 在内的佛教文本数据库。该服务器采用 Rust 构建,具备高性能的文本搜索和检索能力。

🚀 快速开始

daizo-mcp 服务器允许你通过 AI 助手对佛教文本数据库进行实时搜索和检索。以下是一些你可以让 AI 助手执行的操作示例:

  • 按标题搜索:“在 CBETA 中查找《法华经》”
  • 按内容搜索:“在所有 CBETA 文本中搜索提及‘阿弥陀’的文本”
  • 检索特定文本:“展示巴利圣典中《长部》第 1 经的第 1 章”
  • 按主题探索:“《中部》对禅修有何论述?”
  • 模式搜索:“在三藏文本中查找所有出现‘涅槃’或‘内观’的地方”
  • 搜索并聚焦:“查找‘转法轮经’出现的位置,然后展示其前 10 行和后 200 行”

AI 能够实时搜索数千部佛教文本,并提供准确的引用。

另见:日文 README | 繁体中文 README

✨ 主要特性

  • 快速搜索:可在整个文本语料库中进行并行正则表达式搜索,并跟踪行号。
  • 智能检索:具备上下文感知的文本提取功能,支持提取提示和灵活的基于行的上下文。
  • 搜索并聚焦:先查找内容,然后检索可自定义的上下文(例如,前 10 行,后 200 行)。
  • 多种格式支持:支持 TEI P5 XML、纯文本和结构化数据。
  • 自动数据管理:自动下载和更新文本仓库。
  • 缓存机制:对在线查询进行智能缓存。

📦 安装指南

前提条件

下载佛教文本仓库需要 Git。 安装 Git:https://git-scm.com/book/en/v2/Getting-Started-Installing-Git

快速安装

curl -fsSL https://raw.githubusercontent.com/sinryo/daizo-mcp/main/scripts/bootstrap.sh | bash -s -- --yes --write-path

此命令将自动完成以下操作:

  1. 构建二进制文件
  2. 下载 CBETA 和三藏文本仓库(约 2 - 3GB)
  3. 构建搜索索引
  4. 若可用,将其注册到 Claude Code 和 Codex

手动设置

  1. 构建:cargo build --release
  2. 安装:scripts/install.sh --prefix "$HOME/.daizo" --write-path

添加到 MCP 客户端

Claude Code CLI

claude mcp add daizo /path/to/DAIZO_DIR/bin/daizo-mcp

Codex CLI

添加到 ~/.codex/config.toml

[mcp_servers.daizo]
command = "/path/to/DAIZO_DIR/bin/daizo-mcp"

💻 使用示例

搜索命令

# 按标题搜索
daizo-cli cbeta-title-search --query "楞伽經" --json
daizo-cli tipitaka-title-search --query "dn 1" --json

# 快速内容搜索(带行号)
daizo-cli cbeta-search --query "阿弥陀" --max-results 10
daizo-cli tipitaka-search --query "nibbana|vipassana" --max-results 15

获取命令

# 检索特定文本
daizo-cli cbeta-fetch --id T0858 --part 1 --max-chars 4000 --json
daizo-cli tipitaka-fetch --id e0101n.mul --max-chars 2000 --json

# 基于行的上下文检索(搜索后)
daizo-cli cbeta-fetch --id T0858 --line-number 342 --context-before 10 --context-after 200
daizo-cli tipitaka-fetch --id s0305m.mul --line-number 158 --context-before 5 --context-after 100

管理命令

daizo-cli doctor --verbose      # 检查安装情况
daizo-cli index-rebuild --source all  # 重建索引
daizo-cli version              # 显示版本

📚 详细文档

MCP 工具

MCP 服务器为 AI 助手提供了以下工具:

搜索工具

  • cbeta_title_search:在 CBETA 语料库中按标题搜索
  • cbeta_search:在 CBETA 文本中进行快速正则表达式内容搜索(返回行号)
  • tipitaka_title_search:在三藏语料库中按标题搜索
  • tipitaka_search:在三藏文本中进行快速正则表达式内容搜索(返回行号)
  • sat_search:额外的在线数据库搜索

获取工具

  • cbeta_fetch:按 ID 检索 CBETA 文本,并支持指定特定部分/章节
    • 基于行的检索:支持 lineNumbercontextBeforecontextAfter 参数
  • tipitaka_fetch:按 ID 检索三藏文本,并支持章节检索
    • 基于行的检索:支持 lineNumbercontextBeforecontextAfter 参数
  • sat_fetchsat_pipeline:额外的数据库检索工具

搜索并聚焦工作流程

  1. 使用 *_search 查找内容并获取行号
  2. 使用 *_fetchlineNumber 获取匹配内容周围的聚焦上下文

实用工具

  • index_rebuild:重建搜索索引(必要时自动下载数据)

数据源

  • CBETA(中文佛教文本):https://github.com/cbeta-org/xml-p5
  • 巴利三藏(罗马字转写):https://github.com/VipassanaTech/tipitaka-xml
  • SAT(在线数据库):提供额外的搜索功能

环境变量

  • DAIZO_DIR:基础目录(默认:~/.daizo)
    • 数据:xml-p5/、tipitaka-xml/romn/
    • 缓存:cache/
    • 二进制文件:bin/

📄 许可证

MIT 或 Apache 2.0 许可证 © 2025 Shinryo Taniguchi

贡献

欢迎提交问题和拉取请求。请在提交 bug 报告时包含 daizo-cli doctor --verbose 的输出。

  • 0 关注
  • 0 收藏,8 浏览
  • system 提出于 2025-09-21 18:24

相似服务问题