【大河财立方 记者 王宇 上海报道】2月18日,大河财立方记者从上海AI大模型独角兽阶跃星辰获悉,阶跃星辰和吉利汽车集团联合宣布,将双方合作的阶跃两款Step系列多模态大模型向全球开发者开源。
据悉,这也是阶跃星辰首次开源其Step系列基座模型。企业官方公布的技术报告和测试结果显示,阶跃Step-Video-T2V是目前全球范围内参数量最大、性能最好的开源视频生成模型;阶跃Step-Audio是行业内首款产品级开源语音交互大模型。
记者了解到,阶跃Step-Video-T2V模型的参数量达到300亿,可以直接生成204帧、540P分辨率的高质量视频,这意味着能确保生成的视频内容具有极高的信息密度和强大的一致性。
而阶跃Step-Audio则能够根据不同的场景需求生成情绪、方言、语种、歌声和个性化风格的表达,能和用户自然地高质量对话。模型生成的语音具有超自然、高情商等特征,同时也能实现高质量的音色复刻并进行角色扮演,满足影视娱乐、社交、游戏等行业场景下应用需求。
在LlaMA Question、Web Questions等5大主流公开测试集中,阶跃Step-Audio模型性能均超过了行业内同类型开源模型,位列第一。阶跃Step-Audio在HSK-6(汉语水平考试六级)评测中的表现尤为突出,是最懂中国话的开源语音交互大模型。
吉利汽车集团CEO淦家阅表示,吉利致力成为智能汽车AI科技的引领者和普及者,目前,吉利全栈自研的星睿AI大模型已经与阶跃Step-Video-T2V、Step-Audio等大模型完成了深度融合,将为用户带来更智能、更高阶的座舱交互与智驾出行体验,推动AI科技在智能汽车领域的普及。
“阶跃星辰一直以实现AGI(通用人工智能)为目标坚持研发基座大模型,我们深知AGI的实现离不开全球开发者的共同努力。”阶跃星辰创始人、CEO姜大昕博士说,开源的初心,一方面是希望跟大家分享最新技术成果,为开源社区贡献一份力量;另一方面,我们相信多模态模型是实现AGI的必经之路,但目前尚处于早期阶段,期待与社区开发者集思广益,共同拓展模型技术边界,并推动产业落地。
责编:李文玉 | 审校:李金雨 | 审核:李震 | 监审:万军伟