【大河财立方 记者 陈薇】通义千问再度开源了。
9月25日通义千问召开开源发布会,阿里云CTO周靖人在通义千问开源发布会上宣布,全新开源140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat,免费可商用。这是阿里云今年8月份开源通义千问70亿参数通用模型Qwen-7B、对话模型Qwen-7B-Chat、大规模视觉语言模型Qwen-VL后第三次开源。
此次开源的Qwen-14B是一款支持多种语言的高性能开源模型,相比同类模型使用了更多的高质量数据,模型具备更强大的推理、认知、规划和记忆能力。借助基座模型性能,Qwen-14B-Chat生成内容的准确度大幅提升,也更符合人类偏好,内容创作上的想象力和丰富度也有显著扩展。
同时,该模式拥有出色的工具调用能力,开发者可用简单指令教会他使用复杂工具,比如执行Python代码以进行复杂的数学计算、数据分析、图表绘制等,成为拥有文档问答、长文写作等能力的“高级数字助理”。
用户可从魔搭社区直接下载模型,也可通过阿里云灵积平台访问和调用Qwen-14B和Qwen-14B-Chat。
今年8月,阿里云开源通义千问70亿参数基座模型Qwen-7B,短短一个多月,累计下载量突破100万。开源社区出现了50多个基于Qwen的模型,社区多个知名的工具和框架都集成了Qwen。目前国内已有多个月活过亿的应用接入通义千问,大量中小企业、科研机构和个人开发者都在基于通义千问开发专属大模型或应用产品。
目前大模型沿着两条道路发展:一是以ChatGTP为代表的闭源大模型,另一是以Meta的Llama为代表的开源大模型。有人将闭源大模型比作“苹果系统”,开源大模型比作“安卓系统”,开源大模型是否会重新上演一场“安卓式”逆袭?
对此,阿里云CTO周靖人表示:“开源和闭源都是手段,最终目的是将大模型快速应用到场景里。”
IDC报告中提到,由于训练大模型的成本极高,普通开发者和中小企业无从下手,提前布局一套完整的生态系统就变得尤为重要,让大模型从已有走向可用,进而赋能千行百业。对阿里云来说,跑进开源赛道,旨在用开源繁荣大模型生态,让大模型更低成本、更快地落地千行百业。
责编:陶纪燕 | 审校:李金雨 | 审核:李震 | 监审:万军伟