真正的数字农民工——中国AI繁荣的隐秘支柱:内陆农村的数据标注工厂

中国人工智能(AI)的繁荣,通常被描绘成算法与算力的胜利。但在山西、陕西、贵州等内陆省份的县城和社区里,AI正以另一种面貌生长——计算机机房中,坐满了来自农村的劳动者,他们日复一日地为图像绘制边界框,为录音切片对齐,将杂乱无章的世界转化为机器可消化的数据。这些数据标注工作者,构成了中国AI产业庞大而隐秘的底座。
AI需要喂养。它必须被逐片逐块地教授人类社会的知识、价值与规范。数据标注工作者承担着翻译世界的劳动:他们处理原始图像、音频和文本,进行分类、标记与注释。国际上,这类劳动常被置于全球分工的框架下讨论——工程师与模型集中在“全球北方”,标注工作外包至“全球南方”,报酬低廉。但中国互联网巨头并未完全沿袭此路。在敏感项目中,他们更担心数据泄露,因为数据不仅是训练燃料,更接近研发路线图。于是,它们发展出一种“内陆外包”模式,将标注中心从北京、杭州、深圳等总部城市,迁往劳动力成本低廉且更易受地方政府控制的内陆地区。
这些欠发达地区对数据产业张开双臂。地方政府发现,它进入门槛低、劳动密集,又能被包装成数字经济的就业与工业增长政绩。对许多面临人口流失的内陆区域而言,留住人成为首要任务。一位社区干部反复强调:“我们必须留住这里的人。”如果人们真要在此定居,他们需要工作——不必高薪,但须可靠。数据标注中心恰好提供了这种就近的、非高薪的就业机会。
2018年,某个社区迎来了机会。该社区与一家化名为B-Tech的大型科技公司展开谈判,提供三年免租场地和补贴,并承担水电网络维护。作为交换,B-Tech承诺逐步提供就业,并应社区坚持,优先雇佣“处境困难的女性”——教育程度较低、中年或有育儿责任的女性。这类安排使得数据标注中心的管理深度依赖于当地社区关系。管理者清楚哪个员工的孩子几点放学、谁近期眼睛动了手术、谁正经历婚姻危机。这种本地知识成为日常运营的润滑剂。
订单量的波动对维持稳定劳动力构成挑战。当订单减少时,社区与亲属网络的粘性似乎失效,工人开始流失。为此,地方政府推出一种即兴却揭示问题的解决方案:利用培训项目与补贴,使工人保持待命状态,充当平台经济的“减震器”。任何到场签到的人,每日可获得50元(约7美元)补贴。订单锐减时,中心还会申请与扶贫车间相关的额外补贴,使符合条件的工人每月最多拿到500元,以防止离职。
在工作高峰期,工人被分为不同团队。被认为更年轻、精干、家庭负担较轻且效率更高的,被编入高产出团队;而有育儿责任的母亲们,则被安排执行更简单的任务。一位负责AI数据运营的项目经理坦承,公司曾长期认为算法能优化劳动分工与管理,但实际发现,这需要掌握大量员工个人数据,且成本高昂。他直言,当地中心经理凭借经验和对员工的了解进行任务分配,“远比算法更准确、更有效——而且便宜得多。”公司自有中心的标注准确率可达97%至98%,明显优于多数外部平台和第三方工厂。
中国媒体曾将数据标注工描述为“训练AI的老师”。这一比喻并非全错,但过于浪漫。在实践中,这份工作更接近工厂流水线:同样的高密度、低单价、高流失率,以及对视力和神经的损害。它不需要高级证书或稀缺洞见,只需要勤奋、耐力和耐心。许多人想象AI的故事在云端展开——关乎计算、模型与参数。但在中国的偏远山谷里,它更像一条生产线,由那些最难被看见的劳动者驱动。
当我们放低目光,便会发现智能并不独属于机器。它同样建立在那些在计算机前俯首劳作的工人的劳动之上。中国AI的宏大叙事,最终由这些农村机房里的琐碎标注拼接而成。
《美华快报》根据Sixth Tone综合报道。
评论
加入讨论
请登录后发表评论
还没有评论
登录成为第一个评论的人。