谁能训练人工智能?

2020-08-18 09:35   来源: 互联网    阅读次数:186


最近,人类和社会事务部(Department Of Human And Social Affairs)宣布了一些新的职业,其中之一就是人工智能培训师。这听起来像需要培训一流的人工智能吗?谁能训练这些看不见的、不可触摸的人工智能?人工智能培训师到底是做什么的?关键是,你赚得更多吗?


带着这些问题,"经济日报"记者近日访问了百度(山西)人工智能基础产业基地。这是目前国内第一个单一数据标记基地,驻扎在35个企业,AI数据标注员工2300多人。


我是一名数据注释员,中专学位,每天工作8小时,一天能挣300多元。面对记者的提问,山西林诺网络技术有限公司(山西林诺网络技术有限公司)自豪地给出了答案。这个收入对生活在太原市的年轻人来说是很高的--根据数据,太原市城市居民的人均可支配收入在2019年为36362元。然而,李玉龙说他不是最高的。"我的一些同事每天可以挣1000元以上。


李玉龙教育程度低,与人工智能无关。2018年,山西林诺网络技术有限公司成立,李玉龙通过朋友的介绍来到这家公司。


当时,我不知道数据注释器做了什么,更不用说听说人工智能了。老板给了我一套规则,并要求我按照规则识别计算机上的车道。"当时,20出头的李玉龙,在很短的一段时间内就熟悉了这些规则,并总结出了新的标线规则。


作为这一新行业的老员工,李玉龙改变了培训师,除了日常工作外,还承担了公司新员工的培训和教学工作。"一些同事将转变为项目或内容审计师,还有改进的余地。


数据标注的技术门槛低,招聘范围广,对促进就业起到了重要作用。"山西林诺网络技术有限公司负责人李英威告诉记者,目前大学生的招聘情况,打标规则是百度和相关领域的专家共同制定的,形成了一个可操作的软件平台,为企业提供简单的员工培训。以人脸为例,目前可标记约150个特征点。一般的标记规则是,当数据注解器看到双眼皮时,他会标记双眼皮,当他看到狮子鼻子时,他会标记狮子鼻子,这样机器就可以理解并从中学习。你标记的特征点越多,人工智能就越能识别其他人的脸。


在看似简单的工作背后,有一个庞大的数据库来支持它。算法、计算能力和数据是人工智能发展的三个要素,其中数据是人工智能发展的燃料。每天,人类社会产生的大量数据必须被清理和标记,取而代之的是熟悉语言的人工智能,这样才有价值。因此,人工智能培训员的主要任务是数据采集和标注,尤其是数据标注。如果人工智能是一个孩子,那么数据注解者就是引导孩子认识世界的启蒙老师。有了足够和良好的数据,人工智能就能像人一样学会感知、思考和做出决策,从而更好地为人类服务。


他说:"在人工智能工业发展初期,有很多部分的数据采集和标签工作需要人力来完成。"目前的数据平台具有不断学习的能力,大部分的采集和标注工作都可以通过人工智能本身完成,实现预标注和自动标注。因此,目前的数据标注工作主要是以机器辅助和手工标注相结合为基础的。除了眼底检查、肺部X光片等技术内容具有较高的专业要求外,大多数员工都可以按照规定,在平台上完成语音、面部、道路标记操作,只要您能熟练地操作计算机。


郭梅是她新事业的受益者。34岁的郭梅最初是山西省一家煤矿的主管,为了照顾在太原上学的孩子,她到学校附近的一个数据标记基地去找工作。经过职前培训和团队帮助,她从每天画两三百幅画提升到每天超过1300幅画。



随着人工智能的发展,数据定标器的工作不断调整。近几年人工智能发展之初,人们对语音识别、人脸识别、图像识别等有着巨大的需求。近年来,当无人驾驶人士进入发展的快车道时,郭梅和李玉龙的主要工作转向无人驾驶汽车、地图、3D点云和其他数据标记,每天查看车道线、行人和障碍物。


还有一些语音识别项目,比如我们已经收到了一些方言语音数据标注项目,这些项目需要招募当地人才能完成。"李英威说。


有了足够的技术基础,数据营销者也可以教授人工智能的新任务。在疫情爆发期间,对戴着面具的人脸识别的需求激增。"根据客户的需要,从山西数据标记库采集了大量戴着面具的人脸照片,对眉毛、眼镜、颧骨等面部关键点进行了准确的数据标记,并对人工智能进行了训练,以完成面罩图像识别。"百度(山西)人工智能基础数据产业基地负责人魏琦表示:"人们可以不摘下面具,也可以通过人脸门实现精确的体温测量,这是对人工智能的数据标记。


随着全球人工智能产业,物联网和5G的爆发式增长,全球每年产生的数据量将从2016年的16.1ZB猛增至2025年的163ZB,其中80%至90%是非结构化数据,需要进行清理和标记才能唤醒价值,"艾利咨询发布的《中国基础人工智能数据服务白皮书》称。在我国,每年需要标注的语音数据超过200万小时,图片更是数亿张。因此,人工智能数据营销人员的岗位需求将持续增长。尉迟透露,今年基地新招了500多人,未来五年计划培训5万名AI数据培训师,并将引入更多AI合作伙伴。


责任编辑:iiihyt
分享到:
0
【慎重声明】凡本站未注明来源为"中关村热线"的所有作品,均转载、编译或摘编自其它媒体,转载、编译或摘编的目的在于传递更多信息,并不代表本站赞同其观点和对其真实性负责。如因作品内容、版权和其他问题需要同本网联系的,请在30日内进行!
关于我们| 免责声明| 投诉建议| 网站地图| sitemap|