Pdf Reader Mcp Server (@shtse8pdf Reader Mcp)

开发官方认证 TypeScript

🚀 PDF 阅读器 MCP 服务器

这是一个专门为 AI 代理打造的 PDF 阅读器 MCP（Multi-Model Collaboration Protocol）服务器。借助此服务器，AI 代理能够通过 MCP 协议，安全地从 PDF 文件里提取文本、元数据以及其他相关信息。

🚀 快速开始

PDF 阅读器 MCP 服务器为 AI 代理提供了安全提取 PDF 信息的途径。你可以按照以下安装方法启动服务，然后依据示例用法进行操作。

✨ 主要特性

全文提取：从 PDF 文件中提取完整的文本内容。
特定页面提取：读取指定页码或页码范围的内容。
元数据提取：获取 PDF 的元数据，如作者、标题、创建日期等。
页数统计：返回 PDF 文件的总页数。
多源处理：一次请求中可以同时处理多个 PDF 来源（本地路径或 URL）。
安全性高：严格限制文件访问权限在项目根目录内，确保安全。

📦 安装指南

使用 npm 安装

全局安装：

npm install -g pdf-reader-mcp

启动服务：

pdf-reader-mcp start

使用 Docker 安装

拉取镜像：

docker pull sylphlab/pdf-reader-mcp

运行容器：

docker run -p 3000:3000 sylphlab/pdf-reader-mcp

💻 使用示例

基础用法

{
"tool": "read_pdf",
"args": {
"source": "path/to/file.pdf"
}
}

返回结果示例

{
"status": "success",
"result": {
"text": "PDF 文本内容...",
"metadata": {
"title": "文档标题",
"author": "作者名称",
"creationDate": "2023-10-05"
},
" pageCount": 10
}
}

🔧 技术细节

优势

安全性：通过限制文件访问范围确保安全。
灵活性：支持本地路径和 URL 源。
高效性：提供结构化的 JSON 输出，便于后续处理。

使用场景

数据抽取：从大量 PDF 文件中提取有用信息。
文档分析：用于 AI 驱动的内容分析工具。
教育领域：辅助学习管理系统中的文档处理。

未来计划

文档完善：增加更多使用案例和详细说明。
性能优化：进一步提升解析速度和效率。
功能扩展：考虑支持图像提取和注释解析。

🤝 支持与贡献

问题反馈：在 GitHub Issues 提交 bug 或建议。
代码贡献：查看 CONTRIBUTING.md 了解如何参与贡献。

📄 许可证

本项目遵循 MIT License，具体内容请参考 LICENSE。

0 条评论
分类：开发