通用图像生成器MCP服务器是一个支持多供应商的AI图像生成服务器,供MCP客户端使用。借助该服务器,你可以通过任何与MCP兼容的应用程序,利用谷歌(Imagen & Gemini)、智谱AI的CogView - 4或阿里巴巴的百炼模型来生成高质量的图像。
无需手动安装!服务器将自动下载并运行。
选择一个供应商并获取API密钥:
将以下内容添加到你的MCP客户端配置文件(例如claude_desktop_config.json
)中:
{
"mcpServers": {
"universal-image-generator": {
"command": "uvx",
"args": [
"universal-image-generator-mcp"
],
"env": {
"IMAGE_PROVIDER": "google",
"GOOGLE_MODEL": "gemini",
"ZHIPU_API_KEY": "your-api-key-here",
"GEMINI_API_KEY": "your-api-key-here",
"DASHSCOPE_API_KEY": "your-api-key-here",
"OUTPUT_IMAGE_PATH": "/path/to/save/images"
}
}
}
}
环境变量说明:
IMAGE_PROVIDER
:可以是"google"
、"zhipuai"
或"bailian"
GOOGLE_MODEL
:可以是"gemini"
或"imagen"
(仅适用于谷歌供应商,默认为"gemini"
)OUTPUT_IMAGE_PATH
:保存生成图像的目录(可选)见上述快速开始部分。
配置完成后,你可以向你的AI助手提出以下请求:
生成的图像将保存到你配置的输出目录中。
generate_image_from_text
根据文本描述创建图像。
generate_image_from_text(prompt: str, model_type: Optional[str] = None) -> str
参数:
prompt
:要生成图像的文本描述。model_type
:谷歌供应商的可选模型选择("gemini"
或"imagen"
)
GOOGLE_MODEL
环境变量(默认为"gemini"
)。transform_image_from_encoded
(仅谷歌和百炼支持)使用Base64编码的图像数据转换图像。
transform_image_from_encoded(encoded_image: str, prompt: str) -> str
transform_image_from_file
(仅谷歌和百炼支持)转换现有的图像文件。
transform_image_from_file(image_file_path: str, prompt: str) -> str
提示词:"创建一个戴着礼帽、长着翅膀的猪在充满绿色植物的未来科幻城市上空飞行的3D渲染图像"
转换提示:"添加一只可爱的小鲸鱼和猪一起飞行"
供应商 | 模型 | 图像生成 | 图像转换 | 语言优化 |
---|---|---|---|---|
谷歌 | Imagen, Gemini | ✅ | ✅ (仅Gemini) | 英文提示词 |
智谱AI | CogView - 4 | ✅ | ❌ | 中文提示词 |
百炼 | 万相2.1 | ✅ | ✅ | 中文提示词 |
注意:对于谷歌供应商,图像转换仅支持Gemini模型,Imagen仅用于图像生成。
git clone https://github.com/ECNU3D/universal-image-generator-mcp.git
cd universal-image-generator-mcp
fastmcp dev src/universal_image_generator_mcp/server.py
访问 http://localhost:5173/ 使用MCP检查器进行测试。
本项目采用MIT许可证。