据萧山发布消息,近日,全球顶尖的开源数据社区——数搭国际数据开源社区(ZODA Lab)在杭州钱江世纪城投资促进大会上正式亮相。该社区由本土AI数据服务企业整数智能牵头建设,旨在构建高质量开源数据集、打造核心模型评测基准并连接全球专家网络,计划通过两年努力,在钱江世纪城形成全球顶尖的开源数据社区生态。
当前,人工智能(885728)发展进入“场景驱动、高质量后训练”新阶段,但高质量数据来源与模型能力评估仍是行业瓶颈。整数智能副总裁孟卓飞指出,AI模型生产周期(883436)中超过80%时间用于数据处理,数据质量是决定模型能力上限的关键。
瞄准这一需求,数搭社区明确了三大核心使命:
一是构建高质量开源数据集,联合高校与科研机构集中开放分散的优质数据;
二是打造覆盖全部主流模型的核心评测基准,检验模型在代码编写、逻辑推理、金融交易等多元场景的真实能力;
三是连接全球专家网络,通过线上挑战赛、线下工作坊等形式聚集跨学科资源。
社区运营模式突出国际化特色。线上设立数据集平台、模型排行榜及高额悬赏挑战赛;线下将在江边打造“ZODA House”,仿效硅谷顶尖技术社区模式,促进研究员、创业者与投资人面对面交流;国际层面将连接Linux基金会、PyTorch基金会等全球顶级开源生态,建立常态化国际交流机制。
社区名称“ZODA”蕴含深意:Z代表浙江、中国及Z世代创新活力,O代表开源,DA代表数据。
社区公布了清晰的两年发展目标:数据集累计下载量超2亿次,专家规模超过100万人,发布200个以上评测榜单,覆盖100个以上国家和地区,带动AI数据产业规模超100亿元。
数搭社区落户钱江世纪城具有扎实的产业基础。牵头方整数智能是诞生于浙江大学计算机创新技术研究院的本土企业,2021年起步至今已成长为国内AI数据服务标杆,其技术被Qwen、DeepSeek等顶尖模型引用,全球合作顶级机构超3000家。今年3月,整数智能入选浙江省首批高端数据标注基地试点,11个数据集入选省人工智能(885728)高质量数据集建设重点项目。
钱江世纪城优质的营商环境与人才储备为社区发展提供支撑。该区域35岁以下青年人才占比达70%,近三年年均净流入青年人口超1.9万人,北大信息技术高等研究院、浙大计算机创新技术研究院等国家级科研平台在此集聚。
数搭社区的发布是钱江世纪城系统性布局人工智能(885728)产业链的关键一环。此前该区域已启动聚焦国产AI芯片与算法模型适配的“芯模社区”,部署可调用算力2300P,集成80余种主流模型。数搭社区将补上“数据+评测+专家生态”短板,与“芯模社区”形成协同,共同构建“芯片—算力—模型—数据—评测—场景”全链条生态,助力杭州打造“人工智能(885728)创新发展第一城”。
原文:全球顶尖!ZODA来了,就在萧山!(来源:萧山发布)
