万方专利数据库 大数据,并非大企业专利



系列专题:大数据营销

     在以阿里云、盛大云等为代表的云计算企业带领下,已经有越来越多的中小企业开始接触和使用,切实享受到了大数据带给它们的福利。

  时代发展的速度总是能超出大多数人的想像。比如进入2012年后,数据的增长速度依然是爆炸性的,即成指数增长。这使得大数据开始变得越来越重要。从Google Trend上看,2012年呈现突然增长的态势,搜索量比2011年增长了近3倍,这说明关注大数据的人正在趋增。

  这其中的原因得益于宣传及很多现实的例子摆在了面前,例如淘宝网充分利用自己海量商业数据的优势,开发了数据魔方,通过对淘宝海量数据的过滤分析,进行深入的数据挖掘,让企业了解行业市场发展趋势,洞察市场最新热点,时刻掌握竞争对手市场动态,迎合买家购物习惯,最终扩大市场份额。目前数据魔方的用户越来越多,也受到很多用户的好评。

  又比如中移动通过自身网络系统中丰富的数据信息资源,开发的信令监测系统,对用户数据,以及电话信令、网络信令做分析和挖掘,对网络进行了极大的优化,同时也让查询性能提升了5~7倍。这些业界的信息,让越来越多的人充分意识到大数据是接下来企业发展的宝贵财富,需要早日进行准备和推动。

  大数据的“4V”定义

  那么,什么样的数据算是大数据呢?大数据并不仅仅是数据量大,它的定义标准目前业界的标准通常是4V。

  多样化(Variety),即大数据的来源非常广泛,不再局限于传统的数据库,因此它包含了海量的半结构化以及非结构化数据;海量化(Volume),数据量的增长是爆发式的,TB以及PB以上的数据成为了常态。大型互联网公司的数据通常都有数十PB,而要知道人类有史以来所有印刷材料的数据量总和也就是200PB;流通性(Velocity)要求对这些数据进行快速处理,因为数据生产得快,也要求能快速消费掉,比如实时处理;活动性(Vitality)要求对持续到达的数据能敏感反应,大量数据的价值在于它们的时效性。

  因此,要想处理好大数据,一般需要有以下能力。

  数据采集,即对海量数据的收集能力,比如索引抓取、数据库导出、数据转换能力、海量数据实时收集等;数据存储,即PB以上级别数据的存储、备份能力;数据计算,即能够在海量数据上进行分析计算、读取的能力;数据挖掘,即通过建立模型在海量数据上进行迭代运算、提取出有用信息的能力。

  已经有越来越多的中小企业开始接触和使用云计算,并切实享受到了云计算带给它们的福利。相信借助云计算,中小企业将在数据使用上获得更多的灵感,从而带来更多的创新。

  大数据被大企业垄断

  从上面的描述可以看出,大数据的门槛看似很高,因此对企业也提出了很高的要求。在大数据方向上走在前面的企业,一定是那些拥有出色技术实力且有着强大的业务能力和广泛用户的企业。典型的企业就是大型互联网公司,如百度、阿里巴巴、腾讯、新浪等,以及大型国有企业,如中国电信、中国移动、国有银行等。它们已经开始在大数据上发掘到价值,以及找到企业发展的新动力。

  目前的现状与大企业自身的情况是紧密相连的,首先从技术上来说,大企业有技术能力自建平台,存储与消费大数据。大数据对技术能力的要求非常高,即使是大企业,站在技术最前沿,自主研发与紧跟国外先进技术相结合,相关的技术开发也处于摸索与试错阶段,试探着一步步前进。其次,大数据需要大量的资金来建立平台,如对服务器以及人员的投入等,并利用自身业务带来的拥有海量用户以及数据,让数据规模来抵消部分成本。

  而对大量的中小企业来说,它们的数据暂时还没有形成规模,并且不可能所有企业都拥有精通大数据处理的人才。交给外包,则对自身数据失去掌控能力。他们迫切需要的是能接入已有云平台,并得到相应的服务,类似Amazon所做到的那样。

  在国外,中小企业已经在开始使用大数据的过程中受益,这主要源于各大公司在持续地推广和维护的云平台。

  中小企业的大数据机会

  但在信息化的现时与未来,数据充斥着身边的每一个角落。航空公司拥有航线数据,烟草公司拥有销售数据,学校有成绩与排课系统,一个iOS上的App也拥有大量下载用户的数据。这些数据分散,被不同企业用作不同的用途。

  很多大企业内部各个部门都有专门的数据处理人员来处理本部门的数据,当部门及数据量增加时,各部门之间的重复工作就变成了很大的负担,并且数据的统一存储带来的成本优势也推动了大公司将各部分数据慢慢地集中起来统一处理。

  同样,如果把社会看成一个大公司,那么各家中小企业自身的数据部门也会有同样的问题。如何把这些中小企业的数据集中起来,既能省下各个企业自身的成本支出,又能为它们提供标准的专业服务能力,从而把原本分散在各处的数据盘活起来。

  例如,航空公司拥有大量航线数据,每条航线乘机人数、用户特征以及运营成本的统计数据。如何规划出收益最优的路线,如何预测每日的登机人数,如何提高准点率,这些都是通过上述已有的数据计算出的。但随着航线及班次的增加,用户的增加,新的实时需求的提出,原先设计好的数据分析平台很有可能不能满足这些需求,因此需要公司进一步在人力和物力上进行投入。这包括更加强力的数据分析系统,以及更加专业的数据挖掘专家。因此我们认为,随着企业的发展,中小企业的数据也会变得越来越大,需要从现在起就转变观念,提前认识到大数据的重要性,尽早布局或接入已有的开放云平台,避免临时转型的阵痛。

  同时,信息共享也是中小企业所迫切需要的。如何更好地利用大型企业所开放的数据来为自己服务,如何让相关联的数据灵活地互动起来,这些都是能给企业带来极大利益的事。如淘宝数据通过开放平台分享给大量第三方用户,让他们在各自的领域能做出更好的商业判断,比如新浪SAE。

  但如前所述,中小企业目前在大数据使用上面临许多现实的困境。

  (1)成本。自建数据中心,或自己购买服务器的成本是不菲的费用,必须要绕过,比如通过接入已有的云平台来节省掉这部分支出。

  (2)技术积累。大数据的开发需要长期、持续、稳定的人员投入,而这样的人才相对于需求缺口来说少之又少,因此如何为这部分用户降低使用门槛,让更多的人能够简单有效地使用大数据,成为了非常重要的一件工作。

  (3)标准化。目前缺少数据处理标准,每个企业的服务能力和处理能力迥异,造成数据不兼容,信息不透明,这需要通过在实践中分析用户真正的需求,来进一步规范化标准。

  基于以上理由,各大互联网公司已经看到了云平台的价值,它能更多地汇聚起数据,积少成多。

  那么,目前中小企业利用现有大企业的云平台来承载自身数据,以及分享数据,条件是否成熟呢?笔者认为,需要从以下三个角度来重点思考。

  安全问题。数据的敏感性,特别是商业数据的敏感和机密程度是非常高的,当企业自身掌控自身数据时,风险与责任可以自我承担。不过一旦接入云平台后,即将这一切交由服务方时,数据的安全就变得特别重要。数据安全问题包括两个重要的维度,即数据是否会丢失,以及数据是否会泄露。毫无疑问丢失数据是非常容易让人感觉到恐慌的一件事,云平台必须做到数据的绝对安全,为用户采取必要的备份手段。对云平台来说,丢失的哪怕是万分之一的数据,对某个中小企业来说,恐怕就是毁灭性的打击。并且这种不信任感会传递到更多的企业,丧失对云平台的信任。从目前的现状来看,这一点大多数的云平台都做得比较好,比如采用了异地机房的集群备份,同一个集群上数据也会存多份复制因子,以此来保证数据的绝对安全。相对于散布在全国各地的大量中小企业自己管理的数据库来说,云平台的专业性让它总体上更加安全可靠。

  数据是否泄露对于很多企业来说也是非常在意的需求,因为这意味着丢失与竞争对手的先机。过于敏感的数据也是企业的生命,不容许随意的泄露。从目前来看,各大云平台正在加强这方面的技术储备,保密性被日益重视起来。笔者以为,是否信任云平台的保密性,需要取决于对自身数据的衡量,毕竟这些数据以前由企业的专人来负责仍然存在泄露的风险,而云平台把自身以上的所有企业的风险拉到了一个平均线上。因此衡量自身企业是否能达到这个平均线对中小企业来说非常重要。当然随着技术的发展,有理由相信这条平均线会变得越来越高。

  服务能力。包括云平台是否有能力快速处理上面的各种业务,中小企业需要的就是借助云平台强大的计算能力来提高对自身数据的处理速度。云平台是否有足够的稳定性让中小企业用户能够7*24小时工作;是否能极大地降低故障率;是否有弹性扩展能力,在将来企业数增加,企业数据量增加的情况下,能够及时扩大平台的服务能力以及存储能力等。从现状来看,大多数云平台还是能达到基本要求,比如稳定性三个9指标(99.9%)、响应时间秒级等,这些数据正随着技术的发展而不断改善。

  收费标准化。收费标准与服务能力的信息不透明,让中小企业用户在云平台的选择上变得不太容易。当前需要各大云平台能够统一收费标准,更准确地监控到使用情况,并且正确地引导用户。

  目前中小企业可以根据以上几点,来判断自身接入云平台使用大数据的条件是否成熟。比如详细评估带来的收益与面临的风险等。

  在国外,中小企业已经在开始使用大数据的过程中受益。这主要源于各大公司在持续地推广和维护的云平台。比如Amazon EC2(Amazon Elastic Compute Cloud)以及Amazon S3(Amazon Simple Storage Service)。中小企业可以以较低的成本接入Amazon平台,存储和消费自身的数据,不用担心数据的安全。同时,它们可以结合企业自身的发展,按需购买服务,以进一步降低在云平台上的成本。比如当数据有100GB时,购买200GB的Amazon S3空间,而当数据增长到1TB时,再购买2TB的数据空间。按需购买的背后,是Amazon云平台虚拟化技术以及弹性扩展能力的结果。

  Instagram就是典型的使用Amazon平台成长起来的公司,短短的时间就拥有上亿用户、数十亿图片分享、庞大的图片社交信息。Instagram达到10亿美元的估值,仅用了10名员工,这在通常看来是难以置信的。Amazon EC2上强大的云平台分析能力,能够帮助Instagram快速地给用户返回相关联的图片,从而加强社交联系。同样的故事发生在国外大多数新生的中小企业中,以至于在国外几乎所有小互联网公司招聘时,都无一例外地要求有在Amazon EC2以及Amazon S3上开发的经验。

  微软的Azure同样是以开发来为大多数中小企业服务的。它主要包括用Azure Storage来存储数据,以及用SQL Azure来存储关系型数据库。微软的起步虽然晚于Amazon,但是它的优势在于长期维护Windows所留下来的完善的售后支持。因此能够让大多数技术能力相对不够的企业更好地使用云端的服务。

  国内起步虽晚,但我们欣喜地看到,在以阿里云、盛大云等为代表的云计算企业带领下,已经有越来越多的中小企业开始接触和使用,切实享受到了云计算带给它们的福利。相信借助云计算,中小企业将在数据使用上获得更多的灵感,从而带来更多的创新。

  

爱华网本文地址 » http://www.413yy.cn/a/9101032201/55371.html

更多阅读

武汉市“九万方”的来历 武汉九万方

武汉有个地名叫“九万方”,九万方位于武汉市江岸区花桥一带,如果你到九万方去打听一下“九万方”这个地名是怎么来的,很多人都不知道,我去打听过,被打听的人都不知,也不是说所有的人都不知,可能没有问到知情人的身上,在网上查找也是一片空白

中国各大数据库免费账号 万方数据库免费账号

广东商学院-更新new(万方、维普、CNKI等) 2010-9-17http://lib.gdcc.edu.cn/psp/modules/remoteVisit/loadYR-2.html账号:08250601224 密码:123456万方(速度有点慢) 2010-7-3http://219.137.192.223:85/用户名:zslib 密码:libzx万方直

声明:《万方专利数据库 大数据,并非大企业专利》为网友怒神为红颜分享!如侵犯到您的合法权益请联系我们删除