系列专题:大数据营销
3月27日消息,据国外媒体报道,大数据市场也许会繁荣起来,然而不少企业却发现,对于目前一些最新的产品不能配备足够的人手。 据塔塔咨询服务公司(TCS)的调查显示,IT行业人才缺乏,符合条件的大数据分析人士更少,这是许多企业在打造与部署大数据系统时所面临的五大困难之一。 惠普亚太及日本区的BPO总经理以及主管Arindam Dutta也表示:“发现大数据方面的人才,尤其是那些同时具有技术以及商业两方面知识的人,是今天商业界面临的棘手的问题。这是我们面临的最大的挑战。” 已成企业发展瓶颈

“大数据泡沫如果现在存在的话,恐怕并非数据的作用被过分夸大,而主要是由于真正具备资质的数据科学家数量不足导致的。”零点研究咨询集团董事长袁岳认为。 最近,惠普的白皮书以及Gartner的研究都估计说,目前只有13%的企业广泛使用预测分析,小于3%的企业使用规定的功能,比如决策/数学建模、仿真和优化。虽然这些百分比都在上涨,但大多数企业并未充分利用这些先进的分析工具。在Dutta看来,人才的缺乏是上述百分比较低的原因之一。 阿里巴巴支付宝用户价值创新中心是支付宝大数据业务的核心部门,这个只有7个人的团队负责为公司开发出可以销售的商业化大数据产品。虽然阿里巴巴各类业务产生的数据为数据分析创造了非常好的基础条件,然而这个团队却因为招聘不到合适的数据科学家而在研发上进展缓慢。为了改变这一状况,去年7月,阿里巴巴集团成为国内第一家任命首席数据官的企业。 多家咨询机构也都预测了大数据的快速增长和人才需求规模。国际数据公司(IDC)认为,大数据相关人才的欠缺将会成为影响大数据市场发展的一个重要因素。而据该机构预测,中国大数据技术与服务市场将会从2011年的7760万美元快速增长到2016年的6.16亿美元。同样,据Gartner预测,到2015年,全球将新增440万个与大数据相关的工作岗位,且会有25%的组织设立首席数据官职位。 不过,Gartner同时也指出,拥有大数据技能的IT专业人员严重短缺,只有1/3的新工作岗位能招到人。 谁是大数据人才? 那么,大数据人才究竟是哪类人才? 在英特尔中国研究院首席工程师吴甘沙看来,大数据最关键的部分是数据分析和挖掘数据价值。作为复合型人才,数据科学家的职业技能包括数学、统计学、数据分析、商业分析和自然语言处理。相较初级分析人员对数据进行报表的描述性分析,数据科学家需要对数据做出前瞻预测性的深度分析。从目前的人才储备来看,这部分的储备欠缺。 北京丰牵云启信息技术有限公司CEO邓侃博士表示,从知识架构的角度上来说,大数据需要三类人才:第一类是云计算IAAS方面的人才;第二类是掌握机器学习(deep learning)和知识图谱(knowledge graph),能将应用部署到云计算上的人才;第三类是具有专业背景,能够对特定应用做统计和预测的人才。 “从计算机学界的理解来看,我们认为大数据的核心技术是机器学习和知识图谱。这是一种框架性的知识,介于基础设施和应用之间的技术。例如大数据应用的代表谷歌公司就有两个大的开发方向,一个是机器学习,另一个是由搜索团队负责的知识图谱。”他同时认为,掌握第二层知识和技术的人才最为缺少。”邓侃表示。 天津神舟通用数据技术公司总经理何清法则认为,在拥有通用的数据分析和挖掘技术外,还需要有融入特定行业的专业背景。大数据的核心业务必然是一种扎根于特定行业,综合运用已有的存储、分析、挖掘、展现技术,根据用户需求并融入行业特色技术模型的一站式大数据平台业务。他强调说,“综合性人才和技术专家二者缺一不可,就如同经济基础与上层建筑之间的关系一样。” 试水校企合作模式 对于企业来说,虽然人才储备有缺口,但是大数据业务还是得做。 邓侃建议,国内企业可以借鉴国外做法,首先明确企业的战略方向是什么,业务需要哪些大数据支持。比如淘宝金融,它需要大数据实现金融业务处理,那么就需要了解金融行业和Hadoop/MapReduce的人才,而百度则要知道用大数据怎么做搜索,与搜索技术有关的人才就是他们要寻求的。 “虽然目前大数据应用比较少,人才也比较少,但是中国的知识积累并不少,例如中国的学术界和产业界在机器学习上也有积累,现在的问题是如何将这个知识和大数据结合起来。”邓侃认为。 不久前,北京航空航天大学计算机学院、软件学院就已与百度、淘宝、腾讯等企业合作,联合开办国内第一个大数据专业工程硕士。据运作该项目的负责人慧科教育总裁方业昌博士介绍,之所以由这些企业和大学合作来培养自己所需要的大数据人才,是因为考虑到大数据的解剖对象是大量的数据,这些数据只有企业才有,而学校并不生产数据。在企业的支持下,学校就能通过针对性的实践训练来培养企业员工的技能。 何清法表示,目前互联网公司已经意识到人才紧缺的问题,建立了专门的数据科学家团队,但是对于金融、能源等行业公司来说,与专业的数据处理公司合作、使用成熟的产品和技术或许是更为现实的选择。