在得到深刻的启发之后,我们需要动笔写好一篇心得体会,写心得体会可以让我们更加清晰地认识到自己的目标和追求,九九范本网小编今天就为您带来了大数据心得精选7篇,相信一定会对你有所帮助。
大数据心得篇1
在我看来,数据库课程设计主要的目标是利用课程中学到的数据库知识和技术较好的开发设计出数据库应用系统,去解决各行各业信息化处理的要求。通过这次的课程设计,可以巩固我们对数据库基本原理和基础理论的理解,掌握数据库应用系统设计开发的基本方法,进一步提高我们综合运用所学知识的能力。
当我们这组决定做大学生就业咨询系统时,我们并没有着手写程序。而是大家一起商量这个系统概述、系统目标、系统需求、业务流程分析、数据流程分析和数据词典。当这些都准备好了之后,我们进行模块的分工。每个人都有自己的模块设计,而且写出来的代码要求可以实现相应模块的功能,得到理想的效果。当每个人都把自己的分工做好了,最后会由一个人把这些全部组合搭建在一起。我们使用的是html和php相互嵌套使用,当一个系统做好了之后,我会好好地把程序都看一遍,理会其中的奥秘。
我所负责的是数据库的备份和还原还有一些界面的实现。还记得自己刚接触html的时候,觉得很感兴趣,所以有一段时间几乎到了痴迷的程度。然而php是我刚接触不久的一种编程语言。不过觉得它的功能真的很强大,可以开发出很多大型的系统。但是在做备份和还原的时候,要考虑的东西还是很多的。当我遇到错误的时候,感到很受打击。值得欣慰的是,在同学的帮助和大量参考书的查阅下,我把自己的模块做好了。这就是我收获最大的.地方。而且,我明白了遇到困难永不放弃的重要性,我知道了团队合作的重要性,我领悟了只有坚持不懈才会取得胜利。
知识的获得是无止境的,只要你想学,只要你行动,没有什么会难倒我们的。回首这一个多星期的课程设计,我很欣慰。因为我有了动力,有了勇气。谢谢老师对我们的不懈帮助,谢谢学校给了我们这一次实践的机会,也谢谢组员们的关怀。这些美好的回忆美好的东西将永远伴随着我。
大数据心得篇2
两个星期时间非常快就过去了,这两个星期不敢说自己有多大进步,获得了多少知识,但起码是了解了项目开发部分过程。虽说上过数据库上过管理信息系统等相关课程,但是没有亲身经历过相关设计工作细节。这次实习证实提供了一个很好机会。
通过这次课程设计发现这其中需要很多知识我们没有接触过,去图书馆查资料时候发现我们前边所学到仅仅是皮毛,还有很多需要我们掌握东西我们根本不知道。同时也发现有很多已经学过东西我们没有理解到位,不能灵活运用于实际,不能很好用来解决问题,这就需要我们不断大量实践,通过不断自学,不断地发现问题,思考问题,进而解决问题。在这个过程中我们将深刻理解所学知识,同时也可以学到不少很实用东西。 从各种文档阅读到开始需求分析、概念结构设计、逻辑结构设计、物理结构设计。亲身体验了一回系统设计开发过程。很多东西书上写很清楚,貌似看着也很简单,思路非常清晰。但真正需要自己想办法去设计一个系统时候才发现其中难度。经常做到后面突然就发现自己一开始设计有问题,然后又回去翻工,在各种反复中不断完善自己想法。
我想有这样问题不止我一个,事后想想是一开始着手做时候下手过于轻快,或者说是根本不了解自己要做这个系统是给谁用。因为没有事先做过仔细用户调查,不知道整个业务流程,也不知道用户需要什么功能就忙着开发,这是作为设计开发人员需要特别警惕避免,不然会给后来工作带来很大的麻烦,甚至可能会需要全盘推倒重来。所以以后课程设计要特别注意这一块设计。
按照要求,我们做是机票预订系统。说实话,我对这个是一无所知,没有订过机票,也不知道航空公司是怎么一个流程。盲目开始设计下场我已经尝过了,结果就是出来一个四不像设计方案,没有什么实际用处。没有前期调查,仅从指导书上那几条要求着手是不够。
在需求分析过程中,我们通过上网查资料,去图书馆查阅相关资料,结合我们生活经验,根据可行性研究结果和客户要求,分析现有情况及问题,采用client/server结构,将机票预定系统划分为两个子系统:客户端子系统,服务器端子系统。在两周时间里,不断地对程序及各模块进行修改、编译、调试、运行,其间遇到很多问题:由于忘记了一些java语言规范使得在调试过程中一些错误没有发现,通过这次课程设计,我对调试掌握得更加熟练了,意识到了程序语言规范性以及我们在编程时要有严谨态度,同时在写程序时如有一定量注释,既增加了程序可读性,也可以使自己在读程序时更容易。
我们学习并应用了sql语言,对数据库创建、修改、删除方法有了一定了解,通过导入表和删除表、更改表学会了对于表一些操作,为了建立一个关系数据库信息管理系统,必须得经过系统调研、需求分析、概念设计、逻辑设计、物理设计、系统调试、维护以及系统评价一般过程,为毕业设计打下基础。
很多事情不是想象中那么简单,它涉及到各种实体、属性、数据流程、数据处理等等。很多时候感觉后面设计根本无法继续,感觉像是被前面做各种图限制了。在做关系模型转换时候碰到有些实体即可以认为是实体又可以作为属性,为了避免冗余,尽量按照属性处理了。
物理结构设计基本没有碰到问题,这一块和安全性、完整性不觉就会在物理结构设计中添加一些安全设置:主键约束、check约束、default定义等。最后才做索引部分,对一些比较经常使用搜索列,外键上建立索引,这样可以明显加快检索速度,最后别忘记重要安全性设置,限制用户访问权限,新建用户并和数据库用户做相应映射。
不管做什么,我们都要相信自己,不能畏惧,不能怕遇到困难,什么都需要去尝试,有些你开始认为很难事在你尝试之后你可能会发现原来她并没有你以前觉得那样,自己也是可以。如果没有自信,没有目标,没有信心就不可能把事情做好,当其他人都在迷茫时候,自己一定要坚信目标,大学毕业出去即面临找工作,从学习这个专业,到以后从事这方面工作都需要不断地去学习去实践,这次实践可以给我们敲一个警钟,我们面临毕业,面临择业,需要这些实践经验,在困难面前要勇于尝试,这是这次课程设计给我最大感想!
以上基本是这次实习体会了,设计进行非常艰难,编码非常不容易,才发现做一个项目最重要不在于如何实现,而是实现之前需求分析和模块设计。创新很难,有些流行系统其实现并不难,难在于对市场分析和准确定位。设计,是一个任重道远过程。
大数据心得篇3
时光飞逝,我们的实训生活就要结束了。经过短暂的一个星期的实训,我们学习到了许多以前不懂的操作、知识,也明白了实践的重要性,更意识到了自己在计算机上还有许多不足。而最让我感触深刻的是团队精神的重要。
在操作中,我们遇到许多问题,比如我在建立表的途中,许多数据在输入时,经常出现问题,不是这边出错就是那边出错,不过后来也解决了问题,完成了表的建立和所需的前提工作。在后来的操作中,我们遇到了更多地问题。曾经老师讲过的步骤也听得懂,可一实践就重重受阻,就在我们非常焦急,想“怠工”时,我们队员相互鼓励,相互帮助,一步一步做,仔仔细细,一个一个排查错误,遇到不会的酒请教他人。最后总算是功夫没白费,我们用自己的双手完成了自己的任务,当时心里感到特别的有成就感。当然这还是要感谢我的队员们,一群可爱的人。
我感触最深的是我们大家一起做查询、报表、窗体时那种投入,努力的精神。虽然在做查询时有好多查询步骤都没有做成功,但是我们努力了,共同合作过,那么就要相信自己,向老师请教,解决问题,不会的操作就要学会,使我们这次的实训成为真正的锻炼。
通过这次实训,我们对电脑有了更深刻的认识,更让我有机会体验做系统程序的过程是不易的。这将会成为我一生中的宝贵经验,也会激发我对电脑操作的学习。我明白只有不断学习,不断充实,才能够提高自己的能力。更要感谢我们一起的团队,大家的相互激励帮助才完成了今天的任务,这种动力是无穷的。我想说这次实训令我今生难忘,途中的心酸,快乐会让我回味无穷。可爱的同伴们,我们的友谊永留心间,我们是最棒的!
大数据心得篇4
本次课程设计,使我对《数据结构》这门课程有了更深入理解。《数据结构》是一门实践性较强课程,为了学好这门课程,必须在掌握理论知识同时,加强上机实践。
我课程设计题目是线索二叉树运算。刚开始做这个程序时候,感到完全无从下手,甚至让我觉得完成这次程序设计根本就是不可能,于是开始查阅各种资料以及参考文献,之后便开始着手写程序,写完运行时有很多问题。特别是实现线索二叉树删除运算时很多情况没有考虑周全,经常运行出现错误,但通过同学间帮助最终基本解决问题。
在本课程设计中,我明白了理论与实际应用相结合重要性,并提高了自己组织数据及编写大型程序能力。培养了基本、良好程序设计技能以及合作能力。这次课程设计同样提高了我综合运用所学知识能力。并对vc有了更深入了解。《数据结构》是一门实践性很强课程,上机实习是对学生全面综合素质进行训练一种最基本方法,是与课堂听讲、自学和练习相辅相成、必不可少一个教学环节。
上机实习一方面能使书本上知识变“活”,起到深化理解和灵活掌握教学内容目;另一方面,上机实习是对学生软件设计综合能力训练,包括问题分析,总体结构设计,程序设计基本技能和技巧训练。此外,还有更重要一点是:机器是比任何教师更严厉检查者。因此,在“数据结构”学习过程中,必须严格按照老师要求,主动地、积极地、认真地做好每一个实验,以不断提高自己编程能力与专业素质。
通过这段时间课程设计,我认识到数据结构是一门比较难课程。需要多花时间上机练习。这次程序训练培养了我实际分析问题、编程和动手能力,使我掌握了程序设计基本技能,提高了我适应实际,实践编程能力。总来说,这次课程设计让我获益匪浅,对数据结构也有了进一步理解和认识。
一周的课程设计结束了,在这次的课程设计中不仅检验了我所学习的知识,也培养了我如何去把握一件事情,如何去做一件事情,又如何完成一件事情的方法和技巧。在设计过程中,和同学们相互探讨,相互学习,相互监督。我学会了运筹帷幄,学会了宽容,学会了理解,也学会了做人与处世,这次课程设计对我来说受益良多。
课程设计是我们专业课程知识综合应用的实践训练,着是我们迈向社会,从事职业工作前一个必不少的过程。“千里之行始于足下”,通过这次课程设计,我深深体会到这句千古名言的真正含义。我今天认真的进行课程设计,学会脚踏实地迈开这一步,就是为明天能稳健地在社会大潮中奔跑打下坚实的基础。我这次设计的科目是数据结。
数据结构,是一门研究非数值计算的程序设计问题中计算机的操作对象(数据元素)以及它们之间的关系和运算等的学科,而且确保经过这些运算后所得到的新结构仍然是原来的结构类型。“数据结构”在计算机科学中是一门综合性的专业基础课。数据结构是介于数学、计算机硬件和计算机软件三者之间的一门核心课程。数据结构这一门课的内容不仅是一般程序设计(特别是非数值性程序设计)的基础,而且是设计和实现编译程序、操作系统、数据库系统及其他系统程序的重要基础。通过这次模具设计,我在多方面都有所提高。
在界面设置中使用函数调用while。其中文本显示颜色和背景颜色都可以任意按照自己的喜好,任意改变,但改变的时候必须采用标准英文大写,同时在制作显示菜单的窗口,大小根据菜单条数设计。最后采用printf输出程序设计界面。
这次的程序软件基本上运行成功,可以简单的建立链式循环链表,并进行输出,及循环语句的运用和选择语句的控制。由于时间和知识上的限制,使得程序规模相对较小,即功能还不很全面,应用也不很普遍。原来c语言可是涉及很多知识,而不是枯燥无聊的简单的代码部分而已,利用c语言方面的知识,我们可以设计出更完善的软件。
通过这次的课程设计,更是让我深刻认识到自己在学习中的不足,同时也找到了克服这些不足的方法,这也是一笔很大的资源。在以后的时间中,我们应该利用更多的时间去上机实验,加强自学的能力,多编写程序,相信不久后我们的编程能力都会有很大的提高能设计出更多的更有创新的作品。
大数据心得篇5
本学期开设的《数据结构基础》课程已经告一段落,现就学习体会进行学习总结。
这是一门纯属于设计的科目,它需用把理论变为上机调试。刚开始学的时候确实有很多地方我很不理解,每次上课时老师都会给我们出不同的设计题目,对于我们一个初学者来说,无疑是一个具大的挑战,撞了几次壁之后,我决定静下心来,仔细去写程序。老师会给我们需要编程的内容一些讲解,顺着老师的思路,来完成自己的设计,我们可以开始运行自己的程序。
这门课结束之后,我总结了学习中遇到的一些问题,最为突出的,书本上的知识与老师的讲解都比较容易理解,但是当自己采用刚学的知识点编写程序时却感到十分棘手,有时表现在想不到适合题意的算法,有时表现在算法想出来后,只能将书本上原有的程序段誊写到自己的程序中再加以必要的连接以完成程序的编写。刚开始学的时候确实有很多地方我很不理解,每次上上机课时老师都会给我们出不同的设计题目,对于我们一个初学者来说,无疑是一个具大的挑战,撞了几次壁之后,我决定静下心来,仔细去写程序。老师会给我们需要编程的内容一些讲解,顺着老师的思路,来完成自己的设计,我们可以开始运行自己的程序,可是好多处的错误让人看的可怕,还看不出到底是哪里出现了错误,但是程序还是得继续下去,我多次请教了老师和同学,逐渐能自己找出错误,并加以改正。tc里检查错误都是用英文来显示出来的,经过了这次课程设计,现在已经可以了解很多错误在英文里的提示,这对我来说是一个突破性的进步,眼看着一个个错误通过自己的努力在我眼前消失,觉得很是开心。此次的程序设计能够成功,是我和我的同学三个人共同努力作用的结果。在这一段努力学习的过程中,我们的编程设计有了明显的提高。
其实现在想起来,收获还真是不少,虽然说以前非常不懂这门语言,在它上面花费了好多心血,觉得它很难,是需用花费了大量的时间编写出来的。现在真正的明白了一些代码的应用,每个程序都有一些共同点,通用的结构,相似的格式。只要努力去学习,就会灵活的去应用它。
以上便是我对《数据结构基础》这门课的学习总结,我会抓紧时间将没有吃透的知识点补齐,克服学习中遇到的难关,在打牢基础的前提下向更深入的层面迈进!
大数据心得篇6
通过两周的课程设计,完成了预定的目标,其中有很多的随想。老师的题目发下来的很早,大概提前了3周,当时就着手搜索有关线索二叉树的思想,思路,借了一本《数据结构—c语言描述》,在大体上就有了一个轮廓,先是输入二叉树,在对二叉树进行线索化,依次往下,但在具体实现时,遇到了很多问题:首先是思想的确定,其非常重要,以前有了这个想法,现在愈加清晰起来,因此,花了大量的时间在插入删除的具体操作设计上,大概三个晚上的时间,对其中什么不清晰明确之处均加以推敲,效果是显著的`,在上机上相应的节约了时间。
通过具体的实验编码,思路是对的,但是在小问题上摔了一次又一次,大部分时间都是花在这方面,这个节点没传过来啊之类的,以后应该搞一个小册子,记录一些错误的集合,以避免再犯,思想与c语言联系起来,才是我们所需要的,即常说的理论与实践的关系。
数据结构是基础的一门课,对于有过编程经验的人,结合自己的编程体会去悟它的思想;而且我觉得随着编程经历的丰富对它的体会越深入,最初接触是对一些思想可能只是生硬的记忆,随着学习的深入逐渐领悟了很多。看了这次课程设计的题目,虽然具体要求没有看清,但是总结一下,可以看出,其需要我们能把一个具体案例或一件事情反映为程序来表达,数据结构就是桥梁,通过自己的设计,使应用能力得以融汇,对与问题,具有了初步的分析,继而解决之的能力,感觉对以后的学习会有很大的帮助,学习无非是用于实践。
认识到自己的不足,希望能有进一步的发展。
大数据心得篇7
产业勃兴,数据标注员成为新兴职业。目前国内至少有大小近千家标注公司,共20余万名数据标注员。
在上海徐家汇一家广告公司做文案的索琳,从未想过自己也能参与打磨人工智能的应用。她最近接到任务,教一位只存在于手机应用程序里的“老爷爷”与用户对话。比如,当用户问“世界上谁最美”,他就会回答“当然是你最美”。一问一答均由索琳事先写好,再由一家擅长语音识别的人工智能(ai)公司植入。索琳编写了近3000条问答,一心想把“老爷爷”培养得更风趣、睿智。不过,实际上她只是提供了最基础的数据。
一千多公里之外的贵州惠水县百鸟河数字小镇,一家提供数据服务的公司,22岁的吴潘威正对着电脑用鼠标“贴标签”:将一张普通道路交通图中的机动车、行人、非机动车逐一框中……和索琳教机器对话一样,吴潘威贴标签的目的是教人工智能看图识物,他们被叫作“数据标注员”。
当前,以互联网、大数据、人工智能为代表的新一代信息技术日新月异。人工智能在去年、今年两度被写入政府工作报告;而大数据,已经成为世界认识贵州的新名片。在脱贫攻坚主战场的贵州,大数据的经济增速已连续7年位居全国前列。
在百鸟河数字小镇,仅吴潘威所在的梦动科技有限公司就有400多名标注员。他们是踩着信息技术浪潮的流水线工人。
1
“教机器认识这个世界”
这是一张微笑的普通女性的脸,她的鼻子、嘴巴、眼睛、眉毛和脸部轮廓布满了点,一共有149个,它们被叫做“人脸关键点”。
在百鸟河数字小镇,吴潘威与同事们坐在电脑前,将图片放大,用鼠标移动这些小点,使它们落在合适的位置。吴潘威浏览了成千上万张人脸图片,在他的眼中,这些人脸没有肤色、性别、老少之分,只有清晰与模糊的区别,一张像是从监控摄像里截取的模糊图片会让他多花几倍时间。
人工智能本身不会识别物体,而要依靠海量训练。当人脸关键点被一一标注之后,计算机才能建立起对人脸的认知。而人脸关键点的数目并不固定,不同数目的背后连接的是不同的算法。“吴潘威们”只需按照人工智能工程师们设定的数目规范来标注。换言之,这些数据标注员并不需要了解算法之复杂,他们所做的,更像在工厂流水线重复作业。
百度无人驾驶汽车,是梦动科技接手的第一个项目。公司人工智能服务部总监曾芸说:“刚接到无人车项目时,我们所有人都是蒙的,觉得这个事情不大靠谱,毕竟无人驾驶在我们眼里是高精尖的科技。”
2016年5月,百度派技术人员来开讲座,开诚布公——“你们就是在训导机器,教机器认识这个世界。”那时,所有人都不知道有“数据标注员”这个职业,吴潘威和一起实习的小伙伴们互相称呼“画框的”。
可不就是“画框的”?几十个人坐在电脑前按动鼠标画框,机动车分成大型车、小型车,非机动车分成自行车、摩托车、三轮车,还有行人、交通信号灯,都要一一框起来。
“标注员都是‘滚雪球’带教带出来的,那时一个人一天要画几百个框,以至于后来走在路上看什么东西都想画个框把它框住。”曾芸回忆说。
“后来,看到无人驾驶汽车在美国的硅谷跑,在乌镇的世界互联网大会跑,说实话还是蛮振奋的。”吴潘威腼腆地笑着说,不管科技有多先进,至少无人车里出现的路况扫描图像他是熟悉的,“也许那就是我之前标注过的。”
那种感觉,就像一不小心踩到了时代潮流的浪尖上。
2
“指数级增长”
吴潘威是贵州盛华职业学院新近毕业的大学生,2016年初到梦动科技当实习生。在这里,一间办公室大约能容纳60名数据标注员,每张办公桌后面都藏着一张稚嫩的脸,几乎每个人都戴着耳机听音乐,同时不停地切换图片、移动鼠标,在屏幕上打点或者画框。
他们大多是像吴潘威一样年轻的大学生。除了盛华职业学院,还有来自黔南民族医学高等专科学校等4所学校的实习生。
但最早,这项工作并不是由实习生来做,而是那些年薪百万的人工智能工程师。
31岁的杜霖是倍赛(北京深度搜索科技有限公司)的首席执行官,公司在北京、山西、山东、河南、四川、贵州、福建等地建设数据标注工厂,有近3000人的数据标注员团队。“对ai 和数据的研究,我们很早就开始了。”毕业自上海交通大学的杜霖告知,他的创始团队均来自上海交大。
最早在2014年,杜霖注意到,随着人工智能在商业场景的应用逐渐落地,原来由工程师在实验室完成的数据标注呈“指数级增长”,工程师们应接不暇,专业的数据加工服务公司应运而生。
国务院发布的《新一代人工智能发展规划》显示,到2020年,我国人工智能核心产业规模超过1500亿元,带动相关产业规模超过1万亿元。杜霖判断,未来人工智能领域一定会出现巨大缺口——对于由人标注的数据的需求。“因为现在的人工智能还只是两三岁的孩子,需要我们不断地教它认识杯子、水果、玩具和汽车。”
作为人工智能产业的下游端,“吴潘威们”对行业勃兴的感知或许是最敏感的。
“从去年起,一个个项目接踵而至。”曾芸说,“目前梦动所承接的项目几乎囊括所有人工智能领域:图片、文本信息、语音、视频、在线审核等,其中图片是最大的一块。”
吴潘威已经记不清标注过多少项目,“五花八门,难以想象”。无人售货超市里,商品种类数以万计,光背包就有十几种;甚至有美甲店要求训练能识别指甲区域的机器人,那样就不会把指甲油涂到指甲外……
6月29日,在梦动科技,记者看到办公室的柜子上摆放着几十种可口可乐饮料。项目组长蒋纯洁介绍,标注员需要先记住所有产品的类别、口味、容积,同一款产品要仔细看包装颜色和图案细微的不同之处,“否则标注的时候再去看就太慢了”。
“最奇怪的是给猫脸和狗脸打点。”项目主管贾如松说。两个多月前,他们花了整整两个星期给一万多张猫和狗的图片打点,每张脸上要打34个点,“想来想去也没想明白这到底是用来干啥的”。
3
“大学生为什么要来做这个”
吴潘威是最早一批来梦动科技的实习生之一。做数据标注员两年多,当初和他一起实习的同学大多都离开了;而在他实习期间,数不清的实习生来来往往。他们抱怨工作枯燥乏味,没什么前途。
“大学生为什么要来做这个事情?”吴潘威也不止一次问过自己。
出生于1999年的陆森霖是贵州盛华职业学院计算机专业的大一学生,实习近3个月了。学校离公司只有1公里左右,这是学校在产教融合方面的部署。
陆森霖正在做的项目是语音识别,每天的基本任务是将约1800秒的语音输出成文字,将重叠在一起的几个音色分开,这会花费他五六个小时;最麻烦的是专业术语,不懂的名词要上网查;做完之后由质检员核对,如果有错误就会被打回来重新修改。
“我完全不知道意义在哪里。”陆森霖说,“你看我开着音乐,听几百秒就切过来放首歌放松,否则一直听会受不了。”
标注工作单调重复。“再难的项目3天之内就能随便耍了。”标注员梁红说,他是记者碰到的少有的对人工智能感兴趣才来实习的学生。
数据标注行业有一套明确流程:上游的人工智能公司将项目交给中游的数据加工公司或众包平台,后者自行加工或分包给下游的小公司、小作坊,有的小作坊还会分发给“散兵游勇”,比如学生或二三线城市的兼职人员。
而到了下游,项目经过层层转包,利润已经低得吓人。“这与我们一线标注员的付出是不对等的。”曾芸说,早期梦动科技只能从中游的众包平台获取项目,现在则尽量直接对接上游客户。
如今,上游的人工智能公司仍保留少量数据标注员。“我们的全职标注团队主要是处理隐私性高和有特殊要求的数据,比如处理医疗领域的数据就需要有一定专业背景。”云从科技研究院副院长周翔介绍,“其余的数据处理便交给下游几十家数据标注团队。”在被称作“国内首档人工智能挑战类节目”的央视热门节目《机智过人》中,曾与模拟画像专家林宇辉在同一舞台竞技的,就是云从科技所打造的人工智能“御眼重明”。
对一般的数据标注员而言,职业生涯是一眼望得见头的:从一线标注员做起,然后是质培专员(相当于质检)、项目组长、项目主管、项目经理,最后是部门总监。
“简而言之,就像上世纪80年代的来料加工,大工厂可以,家庭作坊也可以。”梦动科技联合创始人农政说,“甚至有人把数据标注员比作流水线上的工人,几个学生、几个零散人员都可以接单。”
农政并不否认目前数据标注确实是一个需要大量劳动力的行业,但他强调,应该看到行业发展的未来,“不能现在看到他们在画框,就判断未来十年他们还在画框。”
今年7月,吴潘威终于作为正式员工与公司签约,成为一名商务助理。实际上,他从未想过自己能留下来。当初一起实习的有近百人,和他一样最终成为正式职工的仅有11人。他们不再做标注员,而是走上项目组长等管理岗位。
“也许这是我们接触最前沿科技唯一的机会。”吴潘威说,他的大多数同学毕业后都去从事销售、中介等工作,而在梦动,他能与最先进的科技公司对接,感受信息技术带来的震撼。
4
“不如我们发明标注机器人来解放自己”
每天早上9时,吴潘威准时到公司。一旦进入工作角色,每个人都是紧张而严肃的,相互之间很少交流,若遇到紧急项目,他们还需要加班加点完成。
短短两年间,从小小的鼠标一端,吴潘威便感受到了另一端世界前沿科技进步的速度,“以前无人驾驶汽车框出基本轮廓就可以了,现在不只是从2d平面进化到3d立体,还要标注车头的方向。”
在梦动科技,“大数据,让一切变得更智慧”等标语随处可见。医疗、金融等人工智能近年来踏进的领域,都在日新月异地改变,而起点就在小镇年轻人的手指尖。百鸟河数字小镇聚集了大数据、教育文化、健康养老、文化旅游等众多公司,是当地着力发展大数据产业所建的新型园区。一幢幢彩色尖顶的欧式小楼,令小镇充满异域风情。
实际上,数据标注本身也是一个要用人工智能来改造的行业,标注工具也正在迭代升级。比如,人脸识别最早均由人工标注关键点,但眼下吴潘威接到的项目里,机器已经打好点,标注员要做的只是最后的校正。
在杜霖看来,其实不必把数据标注看得过于神秘,“说到底人工智能数据标注只是商业外包行业一个非常细的分类,几十年前这种数据外包业务就已存在,比如替银行处理电子表格的公司,但因为人工智能,数据标注才变成了一个独立的行业”。
在数据标注领域,更大的潜在威胁可能并非同行竞争,而是来自机器——当算法足够先进时,少量的数据就能达到效果,到那时,还需要这么多的数据标注员吗?
“也许有一天人工智能会全面取代人类,但数据标注员一定是最后被取代的那批人。”杜霖对此保持乐观态度,“最高明的算法也需要基础的数据学习,而数据标注员,一定是坚持到最后一班岗才把数据交付给机器模型的。”
梦动科技人工智能服务部助理总监龚芳芳也说:“想象把人工智能当作婴儿,而我们可以把他训练成天才。”
人们似乎乐意见到“机器天才”与人类的竞争。根据百度搜索指数,公众对人工智能的关注从2016年起呈显著上升趋势,当年3月的围棋人机大战——alphago击败围棋世界冠军李世石,第一次将人工智能带入大众视野。
5
人工智能是否会替代人类?
对吴潘威来说,这并不是个沉重的话题。“标注员之间还常常开玩笑,不如我们自己发明一个标注机器人来解放我们自己。”他笑着说,“毕竟,人都是懒惰的。”
而在通往未来无限可能性的路上,数据标注员们最大的挑战依旧是克服乏味与寂寞。
一名年轻的标注员说,以前他与一位小伙伴会在一起比,谁今天画的框多,“他框了300个我框了400个,第二天他就不跟我说话,一直框。但是现在,他走了,我才觉得这个工作真是无趣”。
大数据心得精选7篇相关文章: