
海报新闻记者Sun Jie在4月29日清晨报道了Jinan,阿里巴巴开设了新一代Tongyi Qianwen型号Qwen3(定义为Qianwen3)。值得一提的是,Qianwen3参数的数量仅为DeepSeek-R1的1/3,成本大幅下降。该性能超过了世界领先的模型,例如R1和OpenAI-O1,并已达到世界上最强大的开源模型。海报新闻记者发现,Qianwen3是中国第一个“混合推理模型”。 “快速思考”和“缓慢思考”被整合到同一模型中。对于简单的要求,您可以在几秒钟内“还原”答案。对于复杂的问题,您可以在许多步骤中“深入思考”,从而充分节省计算强度消耗。 Qianwen3性能图表根据MGA报告,Qianwen3采用了混合专家(MOE)的体系结构,总参数为235b,只需要22B即可激活它。 Qianwen3具有预训练在训练后阶段提供了36T数据的液体,并提供了许多强化研究,并在思维模型中无缝整合非经过思想的模式。 Qianwen3极大地增强了其理解,对教学,工具呼叫,多语言能力等的认识,在检查守则功能的livecodebench检查中,Qianwen3打破了70点的标记,甚至超过了GROK3;在评估模型人类偏好一致性的Arenahard评论中,Qianwen3以95.6分超过了OpenAI-O1和DeepSeek-R1。尽管性能大大提高,但扩大Qianwen 3的成本也大大下降。只有4 h20易于部署Qianwen 3全血版本,而视频记忆消耗只是具有相似性能的模型的三分之一。 Qianwen 3还提供了丰富模型的版本。所有Qianwen3模型均为混合漏洞模型。 API可以设定“思维预算”(即,深入思考的预期最大代币数量)Emand,并认为不同的程度不同,灵活,可以满足AI应用程序和不同情况的不同性能和成本。例如,4B型号是手机的尺寸很大。 8B可以正确部署在计算机和汽车方面; 32B对于大型企业扩展最受欢迎,并且有条件的开发人员很容易开始。了解Qianwen 3系模型仍然使用松散的Apache 2.0分析来打开资源,并首次支持119多种语言。全球开发人员,研究和商业机构可以免费在摩登社区和拥抱面上的平台上下载和商业使用模型,还可以致电阿里巴巴云Baiilian的Qianwen 3 API服务。单个用户可以立即通过Thyi App体验Qianwen 3,并且夸克即将连接到Qianwen 3。据报道,阿里巴巴·塔利(Alibaba Talyi)开设了200多个型号,拥有300多个磨机离子在全球范围内下载,超过100,000多个Qianwen的衍生型模型超过了美国。