芒种刚过,河南郏县东郊,望不到边的农田里,农民们弯腰割起了小麦。不远处机械厂、汽车修理厂,机器声此起彼伏。但再往西的建材广场却人来人往,这些天,广场三楼,来了个长了眼袋的人。
这个人中,有刚从玉米地里匆匆赶过来的农民,连草帽也没来得及摘下。有机关大楼下了班的公务员,也有服装店里请了假的导购员。年轻小姑娘们聚在一起,谈论着护肤和美妆。角落里,大腹便便的中年大叔点了根烟,低头玩起手机。
他们被轮流带进了临时搭的摄影棚里——一个光线昏暗、不到30平米的小房间,墙壁不久前刚被刷得雪白,里面摆着椅子、三脚架和灯光器材。
有人指引他们坐在椅子上,面朝一部被固定在黑色三脚架上的手机,手机和眼袋者之间的距离是25厘米,不能多,也不能少。每次开拍前,一名皮肤黝黑,身材微胖,长着老实憨厚方脸的员工都会掏出卷尺,仔细再量一遍。
方脸员工叫张凯。量完距离后,他需要用5部像素不同的手机拍摄这些有眼袋的人。
在白光、*光、暗光等不同光线下,张凯拍了四轮,加起来总共张。一般情况下,他3分钟就能拍完,不会超过5分钟。
这项工作名为“数据采集”,眼袋者能得到一个价值一二十元的塑料大桶作为奖品。采集而来的照片、语音等数据,将会提供给人工智能企业,用于机器的训练和学习。
刚接下任务时,领导告诉张凯,这次被拍下的双眼袋,会用来给一款手机软件做测试,以便优化软件的美颜功能。但具体怎么测试、怎么优化,领导没说,张凯也没问。
拉对一个框能赚4分钱
去年夏天,张凯有了孩子,他辞掉了原本在石子厂维护器械的工作,回家照顾妻儿。一两个月后,张凯得重新工作养家,一家名为“千机数据”的公司正好在招人,“轻松、离家近、工资高”。
公司在县城东边一个建材广场的三层,从张凯的老家长桥镇开车过来,只用20分钟。他推开公司门的那一刻,空调的凉风灌进身体,面前的场景让他有些震惊:几百名员工坐在棕色的沙发上,埋在电脑屏幕前,不停地拖动鼠标,敲击键盘,“像个大网吧”。
河南郏县一家数据的办公室,如同一个大网吧。新京报记者周小琪摄
人力主管向他介绍说,公司主要做数据标注,简单来说就是给图片上的物体拉框框,只要会用电脑就能干。每天8点上班,中午管饭,休息1个半小时,下午6点30下班,每个月有三四天的假期,工资保底块,多劳多得。
张凯听得迷迷糊糊,他从没听说过“数据标注”,也不懂为什么拉框。但公司环境好,不像以前一样风吹日晒,当即决定留下来。
他被安排在一个有电脑的工位上。入职后,领导传来一个文件包,里面是一份软件的教学文档和几百张厨房、餐厅的图片。张凯需要做的是:把图片上的碗、碟、杯子、筷子等餐具都框出来,然后选好属性、分好类。拉对一个框能赚4分钱。
张凯觉得很新奇——把这些锅碗瓢盆框出来能干嘛?但初来乍到,他没好意思多打听。
第一天上班,张凯费劲拉了几百个框。他不熟悉规则,比如,三个堆在一起的碗,是应该一起拉一个框,还是分开拉三个框?
可一周后,他已经熟练到每天能拉几千个框,挣多块钱。时间久了,张凯看什么都带框,看到家里厨房的锅碗瓢盆,他第一反应是,框框应该从哪个角度拉?拉多大比较合适?
才来三个月,张凯就开始挑战难度更高的3D全景图。图片都是立体的,有多个平面,分布着各种车辆,有卡车、小汽车、大巴车等,张凯要把车辆都框出来,再分门别类。
这项工作要有良好的空间感才能完成。玩“穿越火线”(一款射击类游戏)的经验帮上了张凯,那款游戏的场景也是立体的,常常需要切换视角来观察敌人。张凯没费多少力气就上手了。
但他偶尔还是有犯难的时候。一次,他框出了一辆三个轮子的电动车,选属性时纠结了好一会儿,选了“三轮车”。刚提交上去,就被审核的领导打了回来,“用电的都是电动车,后面带斗的、不用电的才是三轮车”。
工作了大半年,张凯就已经是公司最优秀的员工之一,但他依旧没问过,拉这些框是为了什么?“我的原则是,我赚我的钱就行,其他的不用管那么多”。
8月9日上午,张凯在测试一款新的采集软件。新京报记者周小琪摄
拍摄有眼袋的人
“数据标注”的工作干了一年,张凯开始接手新任务“数据采集”。这份工作不再是坐在电脑前敲键盘,需要走出去,到广场、乡野或工厂,给符合条件的采集对象拍照、录音。
采集而来的数据,将会被打包上传给人工智能企业,企业再把这些数据分配其他公司进行“数据标注”,最后再传回去,成为计算机的学习资料。这些资料能教计算机分辨车辆、厨具等不同的物体,让它们像人一样,去认识大千世界。
张凯的第一项采集任务就是拍摄有眼袋的人。公司给出的要求,卧蚕和黑眼圈都不行,年龄必须在18岁到40岁之间。
找人从公司内部开始。多名员工,只要领导在公司里吆喝一声,满足条件的就自觉过去排队。
员工拍完以后,再发动他们拉着自己有眼袋的亲朋好友来拍摄。除此之外,公司还联系了各个村子有威望、人缘好的人,给他们中介费,让他们来帮忙找,这种方法效果最好。
一开始,张凯完全分不清眼袋、卧蚕和黑眼圈。在他看来,它们都是堆在下眼睑的皮肤组织,只有喜欢熬夜或者上了年纪的人才会有。
为了这次拍摄任务,张凯仔细研究了很多张照片,终于搞明白这三者的区别:眼袋呈倒三角形,浮肿而松弛;卧蚕是椭圆形的,比眼袋小很多,笑的时候才明显;黑眼圈则是乌黑色的、平坦的,不会像眼袋和卧蚕一样凸出来。
但有眼袋的年轻人实在太少,一天最多只能拍十几个。张凯向公司反映后,他们决定把条件放宽,有卧蚕的人也可以参与拍摄,这样一来,多的时候一天能拍到多人。
排队等待拍摄的人。受访者供图
在拍摄前,张凯少不了要回答被拍摄者的质疑。有人问,“照片上有我们的正脸,你们会不会拿来做违法的事?要是把它们用来刷脸支付怎么办?”
张凯想了想,给出解释:“大街上那么多摄像头,如果拍几张照片就能用来刷脸支付的话,走在路上是不是也不安全?”
见对方神情松动,张凯继续说,“我们公司是正规的,在郏县开了两年了,几百号人,跟我们合作的都是大企业,你就放心吧。”
参与过拍摄的人会被拉进