当人工智能忙着“看图说话”“分析指令”,是谁在幕后教它认图识字?答案就藏在数据标注职业工作者的鼠标和键盘里。
作为人工智能技术发展的基础支撑,数据标注正扮演着越来越重要的角色。3月21日,在数据标注产业论坛上,数据标注孵化基地正式启动运营,助力南京市玄武区培育孵化一批AI数据服务企业,为玄武数字产业化与产业数字化发展增添新动能。
同时,这也是江苏国际港围绕江苏数据产业园建设,打造江苏数据产业集聚区,助推这一新兴数据产业发展的又一布局。
3月,国家数据局发布数据显示,我国七个数据标注基地的数据标注规模再创新高,总规模达到17282TB,相当于中国国家图书馆数字资源总量的6倍左右。
风口已至,如何乘势而上?为加快推动江苏数据标注产业高质量发展,玄武今年动作频频。打造数据标注孵化基地,成为其中一大着力点。
基地启动仪式上,江苏国际数据港与江苏跨境数科、科大讯飞、学府集团南京易杰智信息科技、玄武大模型工厂、江苏联著实业、南京邮电大学、南京理工大学、江苏经贸、江苏开放大学等企业、学院携手共建,计划培育孵化一批AI数据服务企业,建设一批具有本地特色的AI数据集,培养一批高质量AI产业人才,形成产学研用一体化的良好生态,推动数据标注产业的创新发展。
江苏国际数据港作为江苏省“数据要素+大模型”产业的核心载体,具备发展数据标注产业的显著优势。
拥有地处长三角地区的区位优势,江苏国际数据港基于云计算、量子加密等技术,为企业提供数据安全合规咨询、数据分级分类安全等服务,覆盖跨国公司双向数据跨境、国内企业境外数据回传、科研数据跨境等多种业务,其建设数据标注基地具有重要战略意义。
数据标注基地的建设离不开完善的基础设施支持。目前,江苏国际港已经投入使用跨境专线网关设备,帮助企业解决跨境访问中的网络问题。同时,计划建设包含公有云、私有云、混合云在内的云服务平台,以及高速、可靠、可扩展的存储系统和多元泛在、智能敏捷、绿色低碳的算力服务。
技术创新是数据标注基地发展的核心动力,玄武区数据标注领域创新建设初见成效。目前,江苏国际港已与高校、科研机构合作,建立联合实验室,开展产学研合作项目,推动数据标注技术与人工智能等产业的深度融合。预计在未来3年内,江苏国际数据港将组建10个联合实验室,达成20项产学研合作,为技术创新提供有力的支撑。
此外,江苏国际港积极鼓励企业加大研发投入,突破数据预处理、智能标注工具等关键技术。
完善的产业生态建设对数据标注行业发展同样重要。江苏国际港积极引导行业AI大模型、数据加工、数据储存、数据脱敏、数据安全等数据产业服务商集聚。通过打造产业生态系统,实现产业链上下游的协同发展,提升产业的整体竞争力。同时,江苏国际港还积极推动数据要素交易市场建设,促进数据要素的流通和交易。
值得注意的是,随着人工智能应用的不断深化,对数据标注的需求也愈发专业化。江苏国际港通过多种方式培养和引进复合型数据标注人才。一方面,积极开展专业培训,与高校合作开设相关课程,培养适应市场需求的数据标注专业人才。另一方面,通过举办技能竞赛等方式,吸引和选拔优秀人才,提升人才的专业素养和实践能力。
AI技术的广泛应用,让数据标注需求呈井喷式增长。然而,行业长期存在的数据来源模糊、隐私泄露、敏感信息不当处理等合规问题日渐突出。就此,江苏国际港通过建立健全数据合规体系,加强对数据的分级分类管理,并搭建“国际数据流通一体化安全治理平台”,涵盖跨境数据合规性检测、跨境数据安全审核等多个子系统,确保数据在标注和流通过程中的合法性和安全性。
人工智能发展离不开高质量数据集,而高质量数据集建设离不开数据标注工作。玄武区以创新为驱动,以合作为桥梁,以人才为支撑,正着力打造具有竞争力的数据标注产业集群,为长三角数字经济高质量发展注入新动能。