需求人群

MMStar主要用于评估和分析大型视觉语言模型在多模态任务上的能力表现,有助于发现模型潜在的问题并指导未来的模型改进。

使用场景

研究人员可以使用MMStar评估自己训练的视觉语言模型在不同视觉语言任务上的表现。模型开发者可以通过MMStar发现自己模型存在的数据泄露问题,并采取相应措施。基准测试的结果可以为进一步改进现有视觉语言模型提供指导和启发。

产品特色

包含1500个高质量视觉语言样本覆盖6个核心能力和18个细分维度人工审查确保视觉依赖性和最小化数据泄露提出多模态增益和数据泄露两个新指标基准测试16种顶尖视觉语言模型

团队介绍

了解 MMStar 背后的团队成员,包括创始人、开发人员、设计师和产品人员。

该产品暂无团队信息。