高质量数据需求持续提拔,政策利好持续。跟着人工智能手艺的快速成长,对高质量数据的需求日益增加。高质量数据集是大模子优化及使用落地的根本,持久来看,高质量的精标数据产物需求强劲,专业化、场景化或将成为行业趋向。此外,持续出台利好政策,鞭策我国智能数据行业的成长,如2024年12月《关于推进数据财产高质量成长的指点看法》、2025年5月《数字中国扶植2025年步履方案》等。
数据标注财产日益增加。我国数据标注财产产值已冲破80亿元,建立335个高质量数据集,标注规模达1。7万亿TB(太字节)。而按照GrandViewResearch测算,2023年全球数据标注和办事市场规模达140。7亿美元,估计2024-2030年的复合年增加率为20。3%。按照IDC预测,2024年全球发生约160ZB的数据量,只要将这些数据转换为机械可以或许识别和进修的布局化数据格局,数据价值才能获得充实阐扬,进而鞭策大模子的持续更新迭代。
数据智能“瓶颈”亟待冲破:按照《数据智能研究演讲(2025)》,我国数据智能扶植次要面对三大瓶颈:起首,缺乏落地实践的方,分歧业业、模子阶段对数据需求差别大,数据处置环节需针对性适配;其次,手艺能力仍存正在短板,例如正在数据采集、清洗等环节,存正在格局兼容、数据质量、特定命据支撑等问题;第三,数据畅通机制还有待完美,包罗根本设备层面机制尚未落地,企业因平安、数据价值难以,订价、授权等不清。