OpenDia是替代Dia / Perplexity Comet的开源方案,它能将你的浏览器与AI模型相连接,无需切换浏览器,能与Chrome、Firefox及任何基于Chromium的浏览器无缝协作。它注重隐私,以本地优先,聚焦于多模态计算平台(MCP)。
如果你并非技术人员,或者从未使用过多模态计算平台,我们建议你使用 Perplexity Comet。
对于Chrome/Chromium浏览器:
opendia-chrome-1.0.6.zip
文件。chrome://extensions/
(或你浏览器的扩展程序页面)。对于Firefox浏览器:
opendia-firefox-1.0.6.zip
文件。about:debugging#/runtime/this-firefox
。manifest.json
文件。⚠️ 重要提示
Firefox扩展程序是以临时附加组件的形式加载的,重启Firefox后会被移除,这是Firefox对未签名扩展程序的限制。
选项1:双击安装(推荐)
opendia.dxt
文件。.dxt
文件进行自动安装。选项2:手动配置 将以下内容添加到你的Claude桌面配置中:
{
"mcpServers": {
"opendia": {
"command": "npx",
"args": ["opendia"]
}
}
}
对于Cursor或其他AI工具,使用相同的配置,或遵循它们的特定设置说明。
npx opendia
# 使用自定义端口
npx opendia --port=6000 # 使用6000(WebSocket)+ 6001(HTTP)
npx opendia --ws-port=5555 --http-port=5556 # 分别指定端口
# 处理端口冲突
# 注意:启动时会自动终止现有的OpenDia进程
npx opendia --tunnel
⚠️ 重要提示
要使用自动隧道功能,你需要安装ngrok:
macOS系统:
brew install ngrok
Windows系统:
# 使用Chocolatey安装
choco install ngrok
# 或者从https://ngrok.com/download下载
Linux系统:
# Ubuntu/Debian系统
curl -s https://ngrok-agent.s3.amazonaws.com/ngrok.asc | sudo tee /etc/apt/trusted.gpg.d/ngrok.asc >/dev/null
echo "deb https://ngrok-agent.s3.amazonaws.com buster main" | sudo tee /etc/apt/sources.list.d/ngrok.list
sudo apt update && sudo apt install ngrok
# 或者从https://ngrok.com/download下载
然后从 https://dashboard.ngrok.com/get-started/your-authtoken 获取免费的认证令牌,并运行以下命令:
ngrok config add-authtoken YOUR_TOKEN_HERE
当你完成所有设置后,可以尝试向你的AI提出以下问题:
内容创作:
"阅读此页面上的文章,并创建一个Twitter线程总结要点。"
研究与分析:
"查看我本周的浏览历史,找出关于机器学习的文章,并总结关键趋势。"
社交媒体管理:
"检查我的Twitter书签,并将它们分类。为每个类别创建一个摘要。"
提高生产力:
"打开我平时早上阅读的网站的标签页,并给我今天头条新闻的简报。"
开发测试:
"用测试数据填写此联系表单,并检查提交是否正常工作。"
个人助理:
"找到我昨天查看的关于React组件的GitHub仓库,并将其标记为稍后查看。"
页面样式与趣味:
"将此页面应用黑暗黑客主题,使其看起来更有趣。" "让这个枯燥的文档页面感觉像一个舒适的咖啡店。" "为这个页面添加30秒的矩阵雨效果,以获得酷炫的截图。" "用高对比度主题转换此页面,以提高可读性。"
OpenDia允许AI模型自动控制你的浏览器。其关键优势在于,它能利用你现有的一切,包括已登录的账户、保存的密码、Cookie、钱包和浏览历史,无需从头开始或切换上下文。
OpenDia可与 Chrome、Firefox及任何基于Chromium的浏览器 配合使用,包括:
对于想要自动化本地测试和开发工作流程的 Cursor用户 来说,它也是一个绝佳选择!
你今天就可以尝试的实际工作流程:
OpenDia为AI模型提供了 18种强大的浏览器工具:
graph LR
A[AI模型] --> B[OpenDia服务器]
B --> C[浏览器扩展程序]
C --> D[你的浏览器]
D --> E[任何网站]
OpenDia为AI模型提供了18种强大的浏览器工具,涵盖智能页面理解、自然交互、标签页和窗口管理、访问浏览器数据、反检测功能以及页面样式与定制等多个方面,使AI能够更好地与浏览器进行交互,实现各种自动化任务。
本项目采用MIT许可证,详情请参阅 LICENSE。
准备好让AI为你的浏览器赋能了吗?立即使用 npx opendia
开启体验吧!🚀