大模型之家讯 8月30日,阿里通义千问宣布推出第二代视觉语言模型Qwen2-VL,其旗舰模型Qwen2-VL-72B的API已在阿里云百炼平台上线。该模型在多个权威测评中展现出卓越性能,部分指标甚至超越GPT-4o和Claude3.5-Sonnet等闭源模型。相较于前代,Qwen2-VL具备更强大功能,包括理解20分钟以上长视频、支持视频问答与对话创作,并能自主操作手机和机器人。此外,它还能理解多语言文本,涵盖中文、英文及多种其他语言。
大模型之家讯 8月30日,阿里通义千问宣布推出第二代视觉语言模型Qwen2-VL,其旗舰模型Qwen2-VL-72B的API已在阿里云百炼平台上线。该模型在多个权威测评中展现出卓越性能,部分指标甚至超越GPT-4o和Claude3.5-Sonnet等闭源模型。相较于前代,Qwen2-VL具备更强大功能,包括理解20分钟以上长视频、支持视频问答与对话创作,并能自主操作手机和机器人。此外,它还能理解多语言文本,涵盖中文、英文及多种其他语言。