Mcp Web Extractor

笔记官方认证本地 TypeScript

🚀 MCP 网页提取器

MCP 网页提取器是一个基于 Model Context Protocol (MCP) 的服务器，借助 Readability.js 实现网页内容的提取。它能够抓取网页并精准提取主要信息，特别适合将简洁、易读的文章保存至 Obsidian 笔记中。

MCP 网页提取器可让你轻松从网页抓取并提取主要信息。以下是使用前的准备步骤。

# 克隆仓库
git clone https://github.com/iemong/mcp-web-extractor.git
cd mcp-web-extractor

# 安装依赖
npm install

# 构建项目
npm run build

# 启动服务器
npm start

服务器启动后将运行于 http://localhost:3000，MCP 终端位于 http://localhost:3000/mcp。

你可以使用包含的客户端示例来从 URL 提取内容：

ts-node-esm client-example.ts

obsidian-integration.ts 文件提供了如何将此 MCP 服务器与 Obsidian 集成的示例。你可以将其作为创建提取网络内容的 Obsidian 插件的起点。

MCP 服务器提供以下功能：

extract-content：从指定 URL 提取可读内容
- 参数：{ url: string }
- 返回：{ title, content, textContent, excerpt, siteName }

本项目采用 MIT 许可证。