您的位置:首页资讯编程开发 → 超越Gemini3、GPT5.1!阿里千问登顶空间推理全球冠军

超越Gemini3、GPT5.1!阿里千问登顶空间推理全球冠军

时间:2025/11/26 21:11:37来源:www.pc6.com作者:学臣我要评论(0)

11月26日消息,今日,空间推理基准测试SpatialBench更新了最新一期榜单,阿里千问的视觉理解模型Qwen3-VL、Qwen2.5-VL位列头两名,超越Gemini 3、GPT-5.1、Claude Sonnet4.5等国际顶尖模型。

SpatialBench榜单显示,Qwen3-VL-235B和Qwen2.5-VL-72B分别斩获13.5和12.9分,领先于Gemini 3.0 Pro Preview(9.6) 、GPT-5.1(7.5)、Claude Sonnet 4.5等海外顶尖模型。

然而,AI大模型的整体表现距离人类仍有差距,人类基准线约为80分左右,可专业处理电路分析、CAD 工程和分子生物学等复杂空间推理任务,目前大模型还无法完全自动化完成此类工作。

据悉,Qwen2.5-VL于2024年开源,Qwen3-VL是阿里在2025年开源的新一代视觉理解模型。

Qwen3-VL在视觉感知和多模态推理方面实现重大突破,在32项核心能力测评中超过Gemini2.5-Pro和GPT-5,不但可调用抠图、搜索等工具完成带图推理”,也可以凭借一张设计草图或一段小游戏视频直接视觉编程”。

同时,Qwen3-VL专门增强了3D检测能力,可以更好地感知空间,基于Qwen3-VL,机器人更好地判断物体方位、视角变化和遮挡关系,实现远处苹果的精准抓取。

目前,Qwen3-VL已开源不同版本,包括2B、4B、8B、32B等密集模型以及30B-A3B、235B-A22B等MoE模型,每个模型都有指令版和推理版两款,是当下最受企业和开发者欢迎的开源视觉理解模型。同时,Qwen3-VL模型也已上线千问APP,用户可免费体验。

据了解,SpatialBench是一项近年来兴起的第三方空间推理基准测试榜单,主要聚焦多模态模型在空间、结构、路径等方面的综合推理能力,被AI社区视为是衡量具身智能”进展的新兴测试标准之一。

SpatialBench不仅测试模型已知的知识,还测试模型在二维和三维空间中感知”和操控抽象概念的能力,这对具身智能的落地尤为关键。


相关视频

    没有数据

相关阅读 外媒:苹果有望超越三星,成为全球最大手机制造商谷歌全面转向Gemini AI,明年3月停用Assistant语音助手对话Articuler:做职业社交里的TinderREDMI产品经理详解K90系列屏幕三大优势:更清晰、更省电、更护眼全球首款骁龙8E5大折叠屏!OPPO Find N6已备案樊振东为REDMI K90系列超级像素屏命名:1:1:1屏搜索广告份额将跌破50%,谷歌Gemini能否撑起AI转型大旗解决Win11重大BUG影响开始菜单/任务栏等功能崩溃的方法

文章评论
发表评论

热门文章 超越Gemini3、GPT5.1!阿里千问进入电脑桌面财报亮眼却难挽颓势!ChatGPT 群组聊天功能

最新文章 超越Gemini3、GPT5.1!“全员AI”成铁律!黄 阿里千问进入电脑桌面,与夸克AI浏览器进行奥特曼:OpenAI首款 AI 硬件原型已落地,两特斯拉ai芯片上市网店用AI生成模特:试穿视频画面诡异

人气排行 安卓模拟器BlueStacks安装使用教程编程语言排行榜2020年9月 TIOBE编程语言排行eclipse字体大小怎么设置 eclipse字体大小plsql developer怎么连接数据库 plsql deveTomcat9.0安装教程 Tomcat9.0环境变量配置方plsql developer怎么使用 plsql developerVisual Studio 2015环境搭建教程Eclipse优化设置教程 Eclipse优化设置技巧