产品功能

  • - 专注于跨图像、视频和文本输入的高效视觉语言理解
  • - 基于LLaVA-UHD v4中的最新intra-ViT早期压缩技术,降低视觉编码计算成本超50%
  • - 支持4x/16x视觉令牌压缩率,在不同任务中实现更灵活的性能-效率权衡
  • - 可部署在iOS、Android和HarmonyOS等常见移动平台,且边缘适配代码开源
应用市场介绍

OpenBMB/MiniCPM-V是袖珍型多模态语言模型,能在手机上高效实现图像和视频理解。专注跨图像、视频和文本输入的视觉语言理解,基于LLaVA-UHD v4中intra-ViT早期压缩技术,降低视觉编码计算成本超50%,支持4x/16x视觉令牌压缩率。可部署在iOS、Android和HarmonyOS等移动平台,边缘适配代码开源。

收起

用户评价

立即分享产品体验

你的真实体验,为其他用户提供宝贵参考

宝石
评论可得 100 宝石
宝石随心兑换应用高级会员,每周更新 前往查看 >>
活动动态 0 人参加
查看更多评论