【来源:钦州发布】连日来,平陆运河多项工程建设迎来重大进展 。平陆运河企石枢纽泄水闸顺利通水, 平陆运河 沙井钦江大桥主塔顺利封顶, 平陆运河马道枢纽...
2025-09-22 0
来源:【四川日报-川观新闻】
编者按:数据标注产业,属于少数有大意义的“小产业”。
说它小,是因为全国市场规模预计今年也到不了300亿元,业内仅有几家上市企业,且其年营收都不超过5亿元。但就是以这般小体量,它却能吸引到国家多部委发专文支持,原因很简单:AI大模型训练亟需高质量数据,而数据标注是高质量数据供给的一个关键环节。
数据标注本质上是将人类知识转化为机器可识别的语言,为AI大模型学习提供“教材”。去年,国家数据局公布了首批7个承担全国数据标注基地建设任务的城市名单,四川省成都市入选。如今试点基地建设已满一年,产业在蓉发展如何?川观智库在专题调研过程中发现了一些值得关注的新情况、新变化。而要深入了解它们,可以从对三个新现象的追问开始。
川观智库研究员 熊筱伟
科技圈有句话:站在风口上,谁都能飞起来。
当前,研究机构普遍判断“中国AI大模型正处于爆发式发展阶段”,川观智库研究员在蓉调研数据标注产业期间,却发现一个怪现象:少数企业的确实现了快速增长,但也有相当一部分企业的相关营收不增不减。
作为AI大模型上游的服务供应商,数据标注企业不应该是订单接到手软吗?为什么部分企业没能借助风口“飞起来”?这背后经历了哪些现实挑战?那些能够“飞起来”的企业又有怎样的发展秘诀?
Part.1
为什么有的企业“没飞起来”?
客观上面临行业“内卷”,主观上没紧跟甲方需求转型的步伐
川观智库研究员采访的9家在蓉数据标注企业均来自行业组织和从业者推荐。在这个有限的样本池中,超过半数企业尚未从风口上“起飞”。
除去成立不足一年的企业外,有7家在蓉数据标注企业向川观智库透露了近年数据标注业务营收的变动情况,其中5家没有明显增长。四川淘金你我信息技术有限公司负责人表示,今年数据标注业务营收预计和去年、前年基本持平。成都小咖邦智能科技有限公司、四川智成云逸信息技术服务有限公司的负责人都预计今年相关营收和去年同比没有明显增长。成都优易智数科技有限公司总经理金守超表示,今年相关营收和2023年的规模大体相当。成都市汇众天智科技有限责任公司总经理骆靖元表示,自2023年以来业务量一直保持平稳,“几乎零增减”。
然而,就在过去几年,ChatGPT发布并于国内掀起AI大模型产业发展浪潮。下游蓬勃发展,为啥上游这些企业的营收没能跟着增加?川观智库研究员调研后发现,除个别企业有自身转型的特殊情况外,主要涉及两个原因——
原因一是行业“内卷”导致营收上不去。受访者普遍反映目前行业竞争太过激烈,以至于出现“甲方有项目,乙方不敢接”的极端情况。路米科技(成都)有限公司、成都优易智数科技有限公司、成都市汇众天智科技有限责任公司负责人都向川观智库研究员提到,现在市面上很多项目都不敢承接,因为竞争导致利润太低、账期太长且存在亏损风险。
综合受访者反馈,“内卷”重灾区主要集中在传统业务以及部分门槛不高的垂类业务(如智能驾驶领域)。金守超表示,企业一度主要从事智能驾驶领域的数据标注,但现在已基本放弃涉足该领域,“(智能驾驶)单子太不好做了。利润率能有5%都算不错了,而且还要项目质量管控很严格才行。一旦没管控好,对方验收不合格就要返工,而一旦返工就可能亏损。”此外,他和多位受访者都谈到,目前甲方结算周期较长,回款时间动辄半年,导致乙方资金压力和经营风险陡增。
原因二是没跟上甲方需求转型步伐。前文提到当前数据标注需求正在发生结构性变化:主要依靠常识的传统需求增长乏力,需要一定专业知识的垂类领域需求则快速增长。对此半数以上的受访企业(5家)表示,目前完全没有或很少承接需要专业知识的垂类领域项目(占年营收10%以内)。与之相应的是,它们当中除1家刚成立不足一年外,其余4家中有3家的近年业务没有明显增长。
Part.2
为什么有的企业能“飞起来”?
在发力垂类业务、避免行业内卷方面探索出了应对之道
借着风口托举,也有企业实现了高速发展。
成都向己科技有限公司CEO谭浩宇谈到,今年企业营收预计约为去年的三倍,而去年营收又是2023年的三倍。澳鹏数据科技(上海)有限公司市场及政府关系副总裁项蔚表示,目前成都子公司成立不足半年,但澳鹏数据中国业务今年上半年同比增长77%,过去五年的年均复合增长率达到90%。
这些企业为什么能够“飞起来”?
从跟上甲方需求转型步伐的角度出发,它们的确都在发力垂类业务。例如,谭浩宇表示,公司主要专注具身智能、医疗两个垂类领域;从应对内卷式竞争的角度出发,它们都在通过加强标注工具研发、团队建设等方式来强化企业护城河。又如,项蔚谈到,会持续布局公司智能化数据生产平台,储备覆盖10大垂类的专业化人才网络。
在川观智库追问下,受访者进一步谈到了实现目标的一些方法论。
如今业内对垂类业务的重要性已有共识,难点在如何跨过专业门槛——简单靠人才招聘并不能解决所有问题。随着垂类业务走向深入,出现大量对口本科生都无法胜任的任务,必须要更高阶人才参与。但这类人才往往有较好职业前景,不愿转行。即便愿意,数据标注企业也很难承受大量雇佣他们的高额薪酬。
如何破局?除了聘请专家兼职外,有不愿具名的企业家谈到可通过任务拆解和培训来降低专业门槛。他谈到一个真实案例:某医疗项目有大量拍摄人体病变器官的医疗影像,需要标注出其中病变位置、类型等信息以供AI大模型学习。正常情况下,这需要大量有经验的医生来完成。但该企业的做法是和少数医疗专家一起,将这个复杂的大问题拆成很多小问题。例如“某个器官某一种病变的主要表现形式有哪几种”,每位标注员就盯着一个小问题进行反复强化训练。“原理类似流水线分工,只要拆解得够细,就把原来需要专家才能干的工作变成让本科生也能完成。”他认为,这样做甚至可以降低对学科背景的要求,但对标注员的学习能力要求很高。
至于应对“内卷式”竞争,有受访企业选择“不卷了”——直接退出竞争激烈的标注环节,而集中发展门槛和收益更高的业务环节。
一家企业负责人坦言,目前内部一位标注员都没有,现有团队主要就干三件事:第一件事是做项目顶层设计,帮助甲方明确到底需要什么、有什么要求,“现在很多客户不太懂(数据标注),他们知道场景需求是什么,但到底需要乙方标注哪些数据、怎么去标注这些数据,就不太能说得清楚。”他提到智能驾驶领域的一个典型需求——标注道路上的汽车。不专业的客户往往只要求把形状类似的车都标成同一类,等工作干到一半才发现应该把校车、消防车等需要特殊应对的车辆分别进行单独标注。顶层设计就是为避免类似情况发生,帮甲方提前明确和完善项目需求、标注规则等,以确保后续工作的效率和效果。第二件事是前文提到的任务拆解;第三件事是根据项目特定需要,定制化开发标注工具——三件事做完后,具体标注工作就外包给第三方执行,“现在市面上不缺能干活的(标注)团队”。他表示经过上述转型,企业营收得以快速增长。此外,多家企业负责人提到在探索延长产业链条,包括从单纯卖标注服务转向卖高质量数据集,下场开发垂类大模型、智能体产品(如机器人客服),等等。
除上述做法外,要实现企业营收“起飞”,其实还有巨大的潜力空间有待发掘。这部分内容川观智库将在《三问数据标注产业③》中继续追问。
本文来自【四川日报-川观新闻】,仅代表作者观点。全国党媒信息公共平台提供信息发布传播服务。
ID:jrtt
相关文章
【来源:钦州发布】连日来,平陆运河多项工程建设迎来重大进展 。平陆运河企石枢纽泄水闸顺利通水, 平陆运河 沙井钦江大桥主塔顺利封顶, 平陆运河马道枢纽...
2025-09-22 0
来源:【四川日报-川观新闻】编者按:数据标注产业,属于少数有大意义的“小产业”。说它小,是因为全国市场规模预计今年也到不了300亿元,业内仅有几家上市...
2025-09-22 0
深圳商报·读创客户端记者 陈燕青近日,华为在法国巴黎举办的全球创新产品发布会上宣布,首次与全球智能影像领先者影石创新展开合作。影石Insta360率先...
2025-09-22 0
中新网杭州9月22日电 (记者 孙自法 由中国科学院与浙江省人民政府联合承办、首次在亚洲举办的联合国教科文组织(UNESCO 第五届世界生物圈保护区大...
2025-09-22 0
天山南北,一个个超级工程不断书写着创造人间奇迹的“超能力”故事。我们选取了八大工程,把他们想象成可爱炫酷的动漫人物:环塔里木盆地750千伏输变电工程—...
2025-09-22 0
来源:睿见Economy9月16日-17日,聚合智能产业发展大会(2025)在武汉市举行,主题为“协同融合创新链产业链 推动聚合智能产业发展”。维他动...
2025-09-22 0
火箭从绘本中“腾空而起”,航天器在指尖“翩翩起舞”,孩子们戴着VR设备惊喜地喊道“摸到星星啦”!近日,一场别开生面的“我的中国航天课”公益AR科普巡展...
2025-09-22 0
9月19日,走进位于平顶山高新区的河南无水染色科技股份有限公司生产车间内,只见一卷卷尼龙面料正通过超临界二氧化碳染色设备快速加工,仅需45分钟即可完成...
2025-09-22 0
发表评论