赋能AI产业创新!深数所构建行业语料集、探索数据跨境流动
大河财立方
2025-03-07 22:06:03
作为全国数据要素流通的核心枢纽,深数所积极响应政策部署,围绕“构建行业语料集”与“探索数据跨境流动”两大核心任务,全面赋能人工智能产业创新,为深圳全速打造人工智能先锋城市贡献“深数所力量”

【大河财立方 记者 王宁宁 深圳报道】日前,深圳四箭齐发推进建设人工智能先锋城市,一日连发4份行动计划,分别涉及人工智能先锋城市、人工智能终端产业、具身智能机器人和瞪羚企业独角兽企业,全方位深层次建设创新之城。

3月7日,大河财立方记者从深圳数据交易所(以下简称深数所)获悉,作为全国数据要素流通的核心枢纽,深数所积极响应政策部署,围绕“构建行业语料集”与“探索数据跨境流动”两大核心任务,全面赋能人工智能产业创新,为深圳全速打造人工智能先锋城市贡献“深数所力量”。

构建行业语料集,为AI训练注入高质量“燃料”

日前深圳印发的《深圳市加快打造人工智能先锋城市行动计划(2025—2026年)》(以下简称《行动计划》),明确提出要“汇聚建成3PB中文语料数据”。

当前,深数所依托深圳丰富的产业生态,已率先成立“开放算料联盟”,联合46家数据商发布超过1100个高质量训练数据集,覆盖医疗、教育、交通、金融等12个重点领域。

在数据共享与交易方面,记者获悉,深数所创新推出“语料券”激励机制,落地全国首单语言语料场内交易、首笔多模态算料集交易闭环,帮助企业实现数据资产估值超2亿元。

深圳毗邻港澳的区位优势为数据跨境流通提供了天然条件。为响应政策号召,深数所建设了跨境数据交易专区,引入香港中易科技跨境电商数据集、Criat金融时序数据等数据资源,服务大湾区企业全球化布局。目前,跨境专区已上线超200个跨境数据产品,涵盖跨境电商、供应链金融等场景。

在跨境数据流动合规方面,深数所联合市委网信办、前海管理局等机构,试点制定重点领域数据跨境负面清单,并推出跨境数据合规评估、撮合交易一站式服务。

筑牢数据安全基座,聚焦三大方向持续发力

人工智能的蓬勃发展离不开安全可信的数据环境。

在数据环境安全方面,记者了解到,深数所首创“法治+信用”动态合规体系,并发布全国首个《生成式人工智能服务交易合规评估规范》,覆盖500余项风险识别点,从数据采集、标注到交易全流程保障合法合规。同时,深数所自主研发AIGC合规服务系统,集成法律知识图谱与大模型技术,累计服务了超1000家AI企业。

在技术层面,深数所联合国家高端智库,搭建数据跨境流动安全实验室,攻关联邦学习、多方安全计算等核心技术,已在自动驾驶、智慧医疗等领域实现商业化应用。例如,通过可信数据空间技术,深数所协助哈尔滨工业大学(深圳)与瑞莱智慧完成医疗语料安全交易,推动AI诊断模型研发效率提升40%。

深数所相关负责人向记者表示,未来深数所将紧密围绕《行动计划》目标,聚焦三大方向持续发力:首先,打造国家级数据交易所标杆,进一步扩容开放算料联盟,不断开发高价值数据集,通过发放“语料券”不断激活交易生态;其次,建设国际数据流通枢纽,深化与前海、河套片区合作,批量上市跨境数据产品;最后,培育“数据×AI”新质生产力,推动数据要素与智能制造、智慧城市深度融合,孵化更多的“人工智能+”创新应用,为深圳高质量发展注入新动能。

责编:陈玉尧 | 审校:张翼鹏 | 审核:李震 | 监审:万军伟


相关资讯