两年前,邢开瑞成立了云南凯瑞智数人工智能科技有限公司,目前主要为自动驾驶汽车、医疗领域提供图像识别、语音识别数据的标注和采集服务,已签约多家人工智能研发企业。
创业两年间,数据标注员流动性大,这直接影响着他挑选项目的标准:量级大、工期长、回款快。“总在招,总是缺。”他自认为招聘标准并不算高,工作内容也不算难:18-30岁,学历、专业不限,会用电脑、肯学肯干、有责任心和耐心就可以,“通俗讲数据标注员就是‘画框’的”。
大模型认识世界的介质是数据——数据标注员通过标注物体形成的数据让大模型认识应该认识的事物,部分数据标注员通常会用“框”来框定目标物的范围。
邢开瑞介绍,前来面试的应聘者大多不了解数据标注员,“不会没关系,只要愿意学,我们就愿意从头教”。
“数据标注就和打游戏差不多,找准通关攻略做,打通关就可以了。”8个月前,这家公司的员工韩志伟完成阶段性“通关”,成为数据标注员。随着项目熟悉度、数据标注质量的提高,他晋级为质检员,负责检查标注员的数据质量。积累多个项目经验后,22岁的他再次升级“段位”,以项目经理的身份带领团队落实项目。
韩志伟见识到另一种“加班文化”:老板让下班,员工却主动加班。数据标注员的基础工资是3500元,达到基础工作量后算作提成,计件工资没有上限,愿意多做就可以多赚钱,“有人在公司做到十一二点,有人忙完家务在家继续做”。
韩志伟做的大多是自动驾驶汽车的项目,在路上看到项目品牌的汽车时,他心里都暗暗自豪,“说不定它以后的行驶路线还是我标注的”。
今年,邢开瑞带着员工从自己家的十几平方米的老旧客厅搬到一栋新租的四层白色新楼里。这个可容纳200名数据标注员的空间里现在有80多名年轻人。邢开瑞说,现在最难的还是招聘数据标注员。“没办法,总有人会离开,也总有人会来,知道这份工作的人太少了,我们只能不停地招。”