如何运营一家数据标注公司
(基础架构篇)
数据标注行业,一个因为人工智能崛起而新兴的行业。
大多数AI实验室、初创型AI公司在发展初期如果雇佣大量的人力进行数据标注,就不得不面临下面两种处境:首先对公司的管理方面就是巨大的挑战,在研发产品的同时还得把大量精力放在如何管理大量标注人员身上。其次大量全职的标注人员的薪酬对于初创型公司和研究实验室也是一个不小的挑战。
为了更好的协调AI公司、AI实验室与群体标注人员的供需关系,本文中所指的标注公司就是在这样的大背景下,应需而生。
那么问题来了,如何运营一家标注公司呢?
本文先从最基础的标注公司架构开始介绍,不同阶段的标注公司的运营是有差别的,可以通过接下来不断更新的文章中获取跟多的信息。
最基础的标注公司应该具备以下4点:
1. 标注员
这也是组成标注公司最重要的一点,有一批优秀的标注员一定可以让你的公司事半功倍。那么怎么样的标注员才能算是优秀呢?这里有几个衡量标准:首先数据标注的终端是AI、是人工智能。数据标注的最终数据是为计算机服务的,所以越精细的标注对计算机的训练越高效,这就要求我们的标注员一定要是一个细心认真的人。越细心、越认真,标注数据的精细度就越有保证。其次,因为需要标注的数据的场景是千变万化的,会有各种各样复杂的场景出现,这就要求我们的标注员要有较强的观察能力。观察能力越强的人,标注出的物体轮廓也就离物品的真实轮廓越相近,越准确。最后,因为数据标注在单一的场景中需要重复一个或者几个动作,除去判断,这种重复的劳动是相对比较枯燥的,这就要求我们的标注员需要有耐心能够坐得住。越有耐心,能坐得住,标注数据的稳定性就越有保证。
2. 审核员
审核员一般都是从优秀的标注员中挑选出来的。因为数据标注是一个类似于熟能生巧的行业,一个标注员接触过的标注对象越多,场景越复杂,那么他也就越有可能更快、更准确的判断出复杂场景中的被标注元素,这些都是靠时间和经验堆积出来的。自身是一个优秀的标注员,这种标注员在审核时会同样把自身对标注的要求传达给其他标注员,这对于提升标注数据的整体质量是有很好的帮助带动作用。
3. 项目经理
项目经理主要就是对于项目组的各个成员(包括标注员和审核员)的管理,项目经理最好是能够有一定的AI基础,有AI基础的项目经理,在和上游需求公司对接的时候能够供轻松的进入项目本身,能够更快更准确的了解上游公司标注的具体需求,减少沟通时间的同时,避免因为沟通规则上的误差导致下游标注员重复返工的情况。
4. 运营总监
运营总监严格意义上也就是公司的创始人了,运营总监基本上就是奔波于各类AI企业,各种AI实验室,说简单一些就是寻找需求方。至于可能大家比较关心的怎么找,本文后续会有更多详细介绍。
人工智能或者说AI会成为未来的趋势,已经是大势所趋,不论国外还是国内的互联网科技巨头都在布局AI产业,从谷歌、亚马逊、Facebook到阿里巴巴、腾讯、百度、京东都在积极的布局自己的AI体系。
与此同时,我们国家的决策层提出:
人工智能是引领这一轮科技革命和产业变革的战略性技术,具有溢出带动性很强的“头雁”效应。
人工智能的未来离我们其实并不遥远。想了解更多关于未来,关于如何站在潮流的前端的朋友们,请多多留意博客更新。