每一家企业都必须对如黄沙般一望无际的海量数据提高警惕,不要天真的认为自己的海量空间像地球一样可以容纳它们。
文/柯志明
我每天都听到身边的人在抱怨硬盘又被无数的数据给塞满了,于是不得不去购买更大的硬盘或者寻求光盘刻录机的帮助,然后再去装载那些不知道为何总是膨胀不休的数据。而企业数据的迅猛增长,同样让每一个企业的CIO都显得有些措手不及。 我在几年前曾与企业的CIO们谈起过企业内容管理。当时,他们所谈到的都是数据分析、知识管理或商业智能等理论性话题,但是现在他们总是打电话问我:为什么我购买了一块又一块的硬盘,一台又一台的存储设备,却怎么也不能装下我的那些数据?而且在我需要它们的时候,它们却总在和我捉迷藏? 我总是对他们说:仅仅依靠海量的存储容量是无法解决他们所遇到的问题的。 之前我听说Google(www.google.cn)曾经希望通过用色彩来帮助用户搜索图片,我感觉到那很有意思,因为图片、视频、音频这些非结构化的数据往往包含着丰富的意义。 很多CIO对我说,他相信自己的系统,尤其是数据库,已经装下了所有的东西,并且可以随时搜索到,但是当我问他们:你对企业内的影音文件、分散的非结构化数据做好准备了么?他们往往哑口无言。 对于如何解决非结构化数据,我的建议是:针对内容管理上的不同阶段,恰如其分地引入应用,制定具有不同针对性的策略,全面涵盖数据的创建、保护、迁移、归档和应用。同时,自文件创建之日起,为它们做好规划。企业制定良好的存储策略的基本原则是把数据妥善分类,按重要性分为动态数据、静态数据和受控数据,配合适当的管理和保护规律。举例来说,我的建议是将所有的数据都进行标记、索引与分类,并将日常需要的数据放在性能最好的在线存储设备上,虽然他们的价格稍高,但是可以保证随需随用,然后,如果能以近线设备而不是在线设备保存需妥善归档数据,可用性及成本效益就会大大增加,而那些需要应对法规遵从却很少被用到的数据可以放在离线存储设备之中。 在当今这个IT界百家争鸣的时代,企业选用不同品牌不同架构的情况可谓司空见惯,在企业中能看到不同架构、不同品牌的存储设备,由此形成了“集百家之大成”的混合IT架构。 这种“集百家之大成”的混合IT架构给企业造成了极大的兼容性问题,即便有着充足的容量也无法解决问题。 我常常听到,某家企业希望通过采用统一品牌的产品来解决这个兼容性问题,但是往往却失败了。这是因为同一品牌的产品也可能基于不同的平台,由低档、中档到高档,由NAS到SAN再到专门为存储不变数据、以符合法规遵从要求的固定存储系统,各不相同。 每次提起这个问题,我都想到“统一存储”,这种新兴的存储系统把NAS、SAN、IPSAN(iSCSI)及光纤通道SAN整合在一起,通过虚拟化等先进技术将不同硬件平台融合在了一起。通过统一存储,企业可以节省置购多重存储系统的成本,也减少了管理多元结构的人力和物力。最重要的是,彻底解决了兼容问题。 曾经有人将无限的数据比喻成沙子,他说这些沙子如果善加利用,可以成为我们生活中最美丽的东西,比如水晶玻璃,或成为IT业界的核心—处理器。但是,如果我们以为地球足够大,因而任由沙子在我们生存的地球上到处飘扬,它们却只能成为人们所厌恶的沙暴,毫无用处。我觉得这个形容非常贴切,每一家企业都必须对如黄沙般一望无际的海量数据提高警惕,不要天真的认为自己的海量空间像地球一样可以容纳它们,否则,结果一定非常的可怕。
责任编辑:张盛炀