当前位置: 首页> SEM




真正的达标的”数据科学家“少如外星人

发布时间:20-11-04

        在FS矿泉水公司工作的小左,某天看到公司招聘“数据科学家”的广告,受这一岗位名称和薪资的吸引,不禁萌发了要去进修一下数据分析方面的知识的冲动——以便自己速成为一个数据科学家。可是再仔细一看岗位要求,一共有七条。对照自己的现实条件,他不由得倒吸了口凉气:

        第一条,需要“数学、统计、计算机等专业硕士学位,博士优先”。小左本科毕业不久,顺利的话,硕士要三年,博士再三年。这样算来,起码是六年以后的事了。小左在大学里也曾想过考研,最终由于家庭经济原因而放弃了。如今看来,要实现自己这个梦想,考研是必须的。专业当然是选计算机比较理想,因其相比于数学和统计,与数据挖掘更接近。但在要不要读博士的问题上,小左陷入了深深的沉思。最后决定,先读完硕士再说吧。

 

        接着看第二条,“有三年以上数据分析或数据挖掘方面经验,有数据挖掘项目实施经验者优先”,这是年限要往上加的节奏了。显然,读完计算机硕士,职业也基本定了,就先干几年数据分析。

        第三条和第四条的英文字母让小左有些目不暇接:“3. 熟悉一种或者几种数据分析方面的工具,比如MATLAB、R、SPSS、SAS等,R优先;4. 熟悉一种或者几种主流数据库,如MySQL、Oracle、SQL Server等,具有数据脚本编写能力以及Hadoop经验者优先”。小左此前虽然也学过一些计算机编程,但对这些工具,除了SPSS、Oracle、SQL Server等有所耳闻,其他还真没有听说过,另外,“R”是什么,这么厉害?看来要学的东西还真不少啊!小左感到无形的压力在逐渐加重。

        第五条看上去有点玄奥:需要“信仰并热爱大数据”。小左心想,大数据是用来“信仰”的吗,莫不成了一种宗教?他有些不太明白,这句不会是某个像京东刘总那样的领导心血来潮想到的吧?

        相比于第五条,第六条相对明白一点:要“较强的数据敏感度,逻辑分析能力,良好的口头表达和文档写作能力”。在小左看来,自己曾受过一些逻辑和写作方面的训练,加上当过营销员的口才,后三项能力应该是没有问题的,而第一项“数据敏感度”可能是最需要加强的。

        最后一条与小左对于大数据的理解最为贴近,也更加具体:“能从大数据中挖掘用户本质属性,并分析用户行为和个性化需求,并不断挖掘新的用户属性数据并据此产生创新的应用”。按小左的理解,大数据本来就是对复杂现实世界的反映,需要找出不同数据背后所反映的一些规律性、模式性的东西,从而更好地满足用户需求。只要把握了用户需求,各类创新的应用自会源源而来。

        上述要求确实不算低。用小左跟同学闲聊时开玩笑的话说:这数据科学家应该是来自某个星星,与“都教授”是一个层次的。

        确实,“数据科学家”被知识管理专家托马斯·德文波特(Thomas H. Davenport)称为“21世纪性感的工作”(the Sexiest Job)。但另一方面,据麦肯锡全球研究院2011年的预估,仅在美国,大数据方面的技术人才缺口为14-19万,管理人才缺口达到150万;“数据科学家”的概念则仍在形成过程中,目前尚无一所高校培育这方面的专业人才。

        单从技术层面看,数据科学应该是计算机、数学和统计几个学科的交叉。但是数据分析技术仅是数据科学家工作的一部分,企业显然并不满足于招聘只懂得技术的人,而是希望Ta同时能与业务有良好的沟通,最好还能有一定的创造性,能于数据海洋中慧眼识珠。

        从目前很多大数据的分析文章中,我们可以看到对数据科学家的各种理解。如有的作者提出数据科学家应该要精通技术和数学,熟悉公司业务,有非凡的创造力,能将数据结构化和可视化,使冷冰冰的数据变得有意义;有很多作者提出,数据科学家要会用数据来讲精彩的故事,故事先于数据;还有的认为数据科学家应当是数据黑客、分析师、沟通师和信托理财规划师的混合体。

        德文波特对此作出总结,“数据科学家最基本、最普遍的技能是会写代码,从长远看,是用各方能够理解的语言进行沟通,用数据来讲故事——无论是口头的还是书面的——最好是二者兼备……他们必须要有强烈的好奇性”,更高意义上,他们要能“形成自己的分析工具,甚至能开展学术类研究”。

        看多了各种对数据科学家近乎神化的描述,不由让人想起管理学大师德鲁克曾经讲过的一个小故事:

        “15年前,当‘运筹学’刚开始流行的时候,有人开出了从事运筹学研究的学者应具备的条件。他们提出的要求是,一位运筹学者应该是一位‘万能博士’。他应该懂得一切,而且对人类各方面的知识都能做出最佳的应用。甚至有人说,运筹学者必须具有62门自然科学与人文科学的知识。如果真能找到这样一位‘万能博士’,让他来研究库存水平或生产规划问题,那岂不是绝大的浪费!”。

        无疑,今天的“数据科学家”与当时的“运筹学家”处于同样的境遇。六十年过去了,我们并没有看到在企业,即使是最卓越的企业中,有所谓的“运筹学者”在进行科学的管理,这就足够引起警醒:要么我们对于数据科学家的岗位要求期望值有些高了;要么这个岗位根本没有那么重要。

        如果回顾上个世纪以来科学管理的发展历程,就能清楚地看到数据科学家的工作其实与泰勒、戴明所分析的工作是一脉相承的。只不过后两者更偏于体力劳动者的工作,而数据科学家更多面向知识工作者,尝试借助于云计算、物联网等新型信息技术的数据采集、存储和处理能力,提升他们的工作效能。但就像企业在推广科学管理和全面质量管理的过程非常强调有全员的参与和支持,最终要内化为企业的文化和精神一样,大数据分析演化之路也绝非一两个精英能够推动的,它也将是一种文化。希望靠某一个天才型的岗位来驱动和改善企业的运营和决策,只是企业的一厢情愿。更有可能出现的结果是:数据科学家的工作将由一个核心专业团队来推动,尽量吸引更多的员工参与,而不是找一个来自星星的都教授这样的超人来承担。

        当然,对于小左这种正在幻想着的年龄的青年而言,成为一名优秀的数据科学家的愿望仍然显得那么真实而可贵。当他一旦打定主意,努力前程,梦想也许并没有看上去那么遥远。

自:36大数据

上一篇: 华尔街日报:数据解读Facebook上市一周年回顾:收入猛增访问时长下滑
下一篇: 风投告诫硬件创业公司八条法则