返回

阿里通义千问Qwen开源视觉推理模型QVQ-72B-Preview

2024-12-25内容来源AIbase基地

Qwen团队近日宣布开源其最新研发的多模态推理模型QVQ,标志着人工智能在视觉理解和复杂问题解决能力方面迈出了重要一步。该模型基于Qwen2-VL-72B构建,旨在通过结合语言和视觉信息,提升AI的推理能力。在MMMU评测中,QVQ取得了70.3的高分,并在多项数学相关基准测试中相较Qwen2-VL-72B-Instruct显示出显著的性能提升。

QVQ模型在视觉推理任务中展现出了特别的优势,特别是在需要复杂分析思维的领域。尽管QVQ-72B-Preview表现出色,但团队也指出了模型存在的一些局限性,包括语言混合和代码切换问题、可能陷入循环逻辑模式、安全和伦理考虑以及性能和基准限制。团队强调,尽管模型在视觉推理方面有所改善,但它无法完全替代Qwen2-VL-72B的能力,在多步骤视觉推理过程中,模型可能会逐渐失去对图像内容的关注,导致幻觉。

电脑版

综合新闻

猜你感兴趣

  • 南方航空
    南方航空
    南航 机票查询 机票预定 航班查询 航空公司
  • 深圳证券交易所
    深圳证券交易所
    深交所 SZSE 全国性证券交易场所
  • 美骑网
    美骑网
    自行车门户网站 完美骑行从这里开始
  • 网易娱乐
    网易娱乐
    有态度的娱乐门户
  • 乐哈健康网
    乐哈健康网
  • 飞卢小说网
    飞卢小说网
    好看的免费小说网 小说听书电子书阅读平台
  • 华为开发者大会
    华为开发者大会
    华为面向ICT领域全球开发者的年度旗舰活动
  • 自媒体经验分享网
    自媒体经验分享网
  • 安徽省妇幼保健院
    安徽省妇幼保健院
  • 科创板日报
    科创板日报
  • 大家都在看

  • 国家企业信用信息公示系统
    国家企业信用信息公示系统
    企业信息查询系统 国家市场监督管理总局
  • 同城约会
    同城约会
    约会 交友 征婚 相亲 找对象 找女友 找男友 免费交友 征婚
  • 智联卓聘
    智联卓聘
    高端招聘 找猎头 找工作 北京网聘咨询有限公司
  • 黑光网
    黑光网
    影楼行业综合门户
  • 国防部
    国防部
    中华人民共和国国防部