信息化应用 营销管理 企业管理 业界消息 站内搜索 标签
首页 » 文档中心 » 信息化软件应用 » BI 商务智能 » 数据存储

数据存储

2003-11-03

摘要:据Gartner公司的一个分析师Adam Couture预测,全世界的存储容量将从2000年的28300TB急速膨胀至2005年的5百多万TB,所有这些都促使公司必须对自己的存储策略进行考虑。

概述

在跟EMC、Hitachi和IBM等公司进行年度结算,然后取回公司服务器所需的存储硬件时,要对公司的存储策略进行考虑。这种考虑是简单的、可预测的。

但另外还有一些东西促使公司必须对存储策略进行考虑。比如公司每隔6到12个月都需要成倍扩充存储容量;在“9.11”之前应该考虑将数据备份到安全的地方;公司正在意识到应该将各个孤立的存储池互连起来,以便让昂贵的ERP、CRM和其他电子商务系统软件的投资回报率达到最大;据Gartner公司的一个分析师Adam Couture预测,全世界的存储容量将从2000年的28300TB急速膨胀至2005年的5百多万TB,所有这些都促使公司必须对自己的存储策略进行考虑。

存储策略正在开始得到应有的注意,一部分原因是受到成本因素的驱使。CIO的独家调查“管理存储”(2002年2月进行的)发现,平均每家公司的这一年的IT方面的总预算中,有22%的部分是分配在存储上的(有些分析者估计这部分预算可能会高达50%)。超过一半的被调查者认为,高级管理已经越来越重视存储问题了。根据这个调查,机敏的首席信息官(CIO)们得认真考虑怎样经济而有效地管理这一属于他们职责的部分——一个5百万TB的庞然大物。

“‘存储策略’刚开始闯入首席信息官们的雷达屏幕”——Mark Shirman,位于麻省弗拉明汉姆的Glasshouse Technologies公司的首席执行官和总裁,同时也是一位存储顾问这样说,“我们在过去的6个月中与约50位的首席信息官谈论过,看到了两种反应,一种是:“是的,存储的确耗资巨大,我们正考虑怎样更好地进行管理”;另一种则是:“啊?”

Harry Roberts是属于前一类型的人,他是Boscov百货公司副总裁和首席信息官,该公司位于宾夕法尼亚州的雷丁,是一家拥有10亿美元资产的零售商。Roberts这样说,“我们正初步采取一些措施将存储当作一个实体来进行管理,比如说,我们已经拟定了一个存储管理的五年计划”。

Roberts预测,他的存储需求将以每年50%的速度递增,他已经反复检测了灾难恢复计划,并且正在评估那些可以帮助他管理日益增长的存储量又不需增加员工的技术,他说:“我们涉及的是若干TB的数据,这是一个需要小心应付的巨量资料,因此我们真的需要仔细考虑。”

麻烦的是,许多数据存放在直接依附的存储设备(DAS)上,这样不同的服务器间不能分享数据或容量,不管服务器是否在本公司内。后果就是,尽管在数据中心里还有不少空闲容量,但不仅这些存储设备难以满足用户需求,而且连IT技术人员也不得不去购买更多的存储设备,雇佣更多的人来管理系统。“这要花大量的钱”——George Medairy,Sheetz公司的IT主管,该公司位于宾夕法尼亚州Altoona,是一家拥有20亿美元的便利店公司,“我们在存储的各方面已经投入了数十万资金”。

进入到存储网络阶段后,网络的发展解决了直接依附存储设备的问题。将存储设备连接到网络上,公司就可以从理论上解决互连问题,更好地管理容量问题。Jerry Mcelhatton,位于纽约Purchase的万事达卡国际机构的全球技术和运作总裁,已将几个区域性存储网络集中在一起形成了一个存储中心,运转着130TB的存储量。他说,尽管公司应用程序已经发生了巨大增长,“我们能增加更多的存储量但不用增加更多员工来维护它,每一字节存储量的成本确实比以前少了。”

McElhatton的做法很有意义,但是存储网络——也许是存储区域网络(SANs),或是网络依附存储(NAS),或是另一些基于国际互联协议的存储——都给存储管理带来新的挑战。比如说,一个直接依附存储方案通常意味着要跟一、两个商家打交道,对比一下,Glasshouse公司的Shirman说,一般对于存储区域网络来说,既要求有存储设备,又要求有软件和网络技术的支持,要用到5至7个商家的产品。

结果就是,信息系统部门需要更多的软件和服务,以便管理网络、分配存储容量和让不同商家的产品协同工作。事实上,一些分析家认为,随着软件和服务需求的增长,原来的硬件预算比例将逐渐减少。那些存储硬件供应商如EMC等也意识到这点,并努力将自己的经营范围扩大到软件和服务领域来保持市场份额。

对于大多数公司来说,是否要转向网络存储不是问题,什么时候进行转变才是问题。“你不得不这样做,”,Sheetz公司的Medairy谈到网络时这样说,“因为用户想成功得到数据。但是这的确改变了存储管理的方式。”。一方面,想要不干扰用户而进行存储网络的维护将会困难得多。“既然有更多的应用程序将用到更多的业务单位所存储的数据,而且这些数据又存储在网络上的不同服务器上,如何分配时间就变得更难处理了”,他这样说,“这不再是一个将几个用户踢出系统的小问题了,这将影响到许许多多的人们。”

有三个技术问题须予以关注:

存储资源管理(SRM)工具,目前可在一些展示会上得到,随时保持着对网络存储容量的鸟瞰,根据需求分配出更多的容量。例如,SRM软件一旦发现客户管理应用程序需要更多的存储容量,它就会找出并重分配一些空闲容量。

存储网络管理(SNM)工具将为存储网络上的所有设备建立一个地图,并进行错误监控,比如网络或服务器错误等,对人工操作进行自动化。
存储虚拟化软件,其功能与Adobe 公司的Postscript软件类似,它可以使各不相同的设备以同样的方式工作,这就大大增强了多种存储设备的协同工作能力。

当上述三种技术能够集成时,企业存储管理就将盛行起来,Steve Duplessie——企业存储研究组(一家位于麻省Milford的研究公司)的元老——这样说。

数据存储:未来趋势

仅在几年前,1GB的存储容量已经让PC用户狂喜了。现今,许多计算机都配置了40GB的硬盘存储器。然而对于更多空间的需求仍在继续,因为用户(消费者和商务活动)想要存储更多的数据,也因为这是可以实现的。只要物理学还没发展到头,这个恶性循环还将无限地进行下去。

为了在一张磁盘上得到更多的存储容量或“空间”,工程师得向盘片的薄膜上填满细小的、磁化的“位”。当某一个位被写时,磁盘的读写头就会确定这个位的方向,或是这个方向,或是另一方向,这样就相当于给这个位赋了一个或为1或为0的值。一个磁盘上的位越多,这张磁盘的存储量就越大。过去的这些年中,工程师们已经使这些位变得越来越小以便能在一个磁盘上存放更多。但是存在着一个临界点,在这个点上,位变得太小以致在室温下都是不稳定的,甚至空气中的热能就能使它们无法正常工作。通过增加盘片上的磁区域,可以减少这些影响,但同时磁盘会变得难以采用传统磁头进行写操作。

现在有一种技术称为“热支持磁性记录”(HAMR)能够解决上述问题。HAMR采用激光技术在数据存储的瞬间减弱磁性,这样那些位就可以冷却下来并永久地或至少到这些位再次被写之前将所存数据保持下来。

HAMA技术在去年十月得到了大力推动,美国国家标准和技术协会授予了美国国家存储行业联盟一个五年的、共1000万美元的支持计划,用于HAMR技术的研究。(联盟中的成员包括磁盘制造商如Seagate技术公司和研究机构如Carnegie Mellon 大学和Arizona大学等)。据Carnegie Mellon的数据存储系统中心的主管Bob White说,这个研究的目标是到五年期间结束时发展出一个工作原型,该项目的总费用估计是2160万美元。

“我们正打算制造一种坚硬的磁性薄膜同时用热量来软化它”,Bob White说,“这是比较讽刺的,这个最初因热而引起的问题,现在我们正在研究的方法却是要用热来解决这个问题”。

当前生产磁盘的技术和方法大概能达到20GB/平方英寸的存储密度,White估计,采用当前技术,工程师们可以将存储密度扩大至约100GB/平方英寸,采用HAMA技术的话,则可再将存储密度提高10倍从而达到1000GB(或1TB)/平方英寸。

White认为,HAMR技术不仅对服务器和个人电脑市场具有重大意义,而且还能使个人设备具有惊人的存储容量。

“要是这项热支持技术开始应用的话,基本上可以肯定,所有的磁盘驱动器都将采用它”。

数据存储:流行用语

数据市场(Data mart)

为某个特定的知识工作者团体服务的数据库,其中数据的来源可以是整个企业范围内的数据库或数据仓库。

数据挖掘(Data mining)

为了分析各种模式、趋势和关系而从数据仓库中提取数据的方法。

数据建模(Data modeling)

分析企业数据并确定数据间的各种关系的方法。

数据净化(Data scrubbing)

监控数据仓库并除掉那些不可信的和过时的数据。

数据仓库(Data warehouse)

一个存储了大量历史业务数据的数据库。

复制(Replication)

对某件东西制作副本的过程,特别当使用计算机的组件时,复制即是指将数据库从一台服务器复制到另一台服务器,这样使所有用户能共享同样的信息。

结构化查询语言(Structured query language)

一种程序设计语言,发音为“sequel”,用来编制对数据库进行信息存取的应用程序。

数据存储:热点问题

Cap Gemini Ernst & Young公司美国地区的副总裁,主要科学技术工程师约翰?帕金森回答了关于数据存储最新趋势方面的问题。

数据存储:今天,推动数据存储市场的动力是什么?

产生数据存储问题有两个因素。一是供应方面的因素。技术越来越先进,每二进制数位存储成本也越来越便宜了。存储单元越来越大了。回顾五六年前,整个西方经济也许只有1PBD(1024TB;1TB=1000000000000B)的数据能有效存储。但是在当前,1/2PB就可以满足你建立一个油田数据存储的需要了。

第二个因素是需求方面的因素。自从我们发现英特网、万维网以及电子商务以来,需要存储的可获得的数据数量以几何级数增长着。这种现象不仅仅存在于类似能源勘探等的工业领域。在这些领域中,先进的技术,精密的仪器以及精确的运算增加了对于数据存储和分析的需要(虽然这是一个很大的因素),同时这种现象也是由于有一亿多人在网上,网站需要将在其网站上进行购物的消费者的情况做一些记录所带来的。网站的日志文件由此变得庞大起来。我们得到了这两个趋于一致的因素——许多廉价存储来自于存储市场,许多需要存储的数据来自于英特网上的经历。那就是为什么存储是一个问题。

数据存储:当这两个因素互相整合时会发生什么?

第一件发生的事情就是使这样一件事情变得显而易见了:在你认为是作为通过服务器安装硬盘的传统存储架构其实是一种很昂贵的方法,因为你需要很多服务器来安装磁盘。我们拥有的所有存储架构是服务器依附型的架构,这种架构限制了你可以放入服务器箱子中的磁盘数量,所以服务器箱子开始增多。这是一个非常艰巨的管理问题。在90年代中期,我们目睹了管理大量数据存储的新技术的发展,也就是网络依附型存储技术的发展。网络依附型存储将磁盘附着于以太网之上,并且存储领域的网络实质上是一系列的磁盘通过环形结构相连接的。这两种方法都有拥护者,在存储架构中都有它们的位置,他们已经成为了主导性的存储方法了。

第二件事情发生的事情就是,一旦你走出了服务器依附型的存储架构,你也同时走出了人们关于你怎样承担类似于支持与恢复数据管理任务的心理上的舒适地带。你能够争辩说因为这种对于存储量的不断修正和调整正在消亡,所以对于在存储还是很昂贵而且少量的情况下成长起来的支持和恢复策略来说,它们还没有与我们现在在公司中非常需要的存储量的结构型需求保持同步变化。

数据存储:行业预测

预计2004年,世界数据存储行业的收入将由1999年的284亿美元增长至533亿美元(年均增长率为12%)。

许多因素都正在驱动着存储需求,包括:应用软件包(客户关系管理、销售力量自动化、数据市场等),国际互联网和企业内部互联网的投资,数据仓库应用软件的增长,存储服务提供商,以及密集存储的消费者应用程序等。

资料来源:国际数据公司(IDC)

数据存储:核查列表

购买存储技术的指导建议。

DAS, NAS和SAN是几个可行的技术,但它们分别适用于不同的需要。因此,你应该选择最适合企业本身业务情况的技术。

不要等到一个租赁合同就要结束,或者到了要实施一个大的技术项目的关头,才考虑购买存储软件。在与卖主谈判的过程中,这种时滞很可能会置你于十分困难的境地。

如果将你的购买时间定在卖主财务报告周期的末期,尤其是在销售代表急需完成限额的时刻,你将更容易达成交易。

要同时和多个卖主谈生意,并且让每一个公司都知道为了得到最好的价格,你也在和他们的竞争对手进行谈判。明确表述从一开始你就希望知道他们最真实的价格,并且不希望通过讨价还价导致价格发生大的变动。

确信卖者必须逐条列出各个相关项目的价格,例如服务器价格、存储器价格、软件价格以及销售服务价格等。这样就可以让采购团队对不同产品进行更加细致的比较和估价。这个列表必需含概建议价格、保修时间以及过了保修时间之后的保养费。

考虑购买二手产品。由于网络泡沫的破裂,一个健全的二手存储设备交易市场已经产生。

按你所需购买存储设备。由于存储设备的价格每年降低40%,因此,如果现在你购买太多空间的话,你就可能要支付多余的额外费用。

存储管理费用常常是隐性的,但是它可能达到硬件费用的三倍。因此,要保证存储设备购买和整个经营战略相一致。

数据存储:更多资料

数据存储和挖掘研究中心

http://www.cio.com/research/data/

这里集中了案例分析、文章和白页等,主要探讨诸如数据挖掘、在线分析处理(OLAP)和数据存储等方面的技术问题。

什么存储方法最适合你的公司?

http://www.isit.com/Doc.cfm?articleid=2898&tech=STO

得到恰当的存储量预算意味着高效率和低成本,根据对存储选择的各种观点,找到能使你的组织得到最好效果的存储方式。(需要进行免费注册)

关于选择性存储最频繁的问题

http://www.dmreview.com/portal.cfm?NavID=91&EdID=3071&PortalID=256&Topic=247

关于新的数据存储选择方面最频繁的问题列表。

InfoStor 杂志

http://is.pennnet.com/home.cfm

InfoStor 杂志为企业存储专业人员提供专业建议、特色文章和独家互联网资源。

智能化存储

http://www.intelligententerprise.com/010524/feat1_1.shtml

由于原始数据量的成倍增长,许多企业运用旧技术来处理问题已无能为力。幸运的是,一波新的解决思维已经从地平线上开始出现了。
你需要存储管理策略吗?

http://www.ntpsoftware.com/WhitePapers/docs/DoYouNeedAStoragePolicy.pdf

正确实施存储管理策略将使你的公司得到什么利益?(免费的pdf 文档)

对上述资料有任何问题可查阅参考资料:http://www.cio.com/summaries/enterprise/data/biblio.html

相关链接
CRM中的商业智能(BI)系列_3:何为客户...2003-11-14 商务智能与数据挖掘概述2003-11-27
Web服务使实时业务之间的联系更加密切2003-10-15 超市零售业信息化出路2003-12-01
智能企业的几个特征2003-10-11 客户需求影响数据库软件市场2003-12-09
CRM中的商业智能(BI)系列_2:数据挖掘...2003-10-04 虚拟数据仓库的优点2003-12-17
商业智能系统2003-09-21 DM的方法论2003-09-19
信息化软件应用目录
OA 办公自动化系统 CRM 客户关系管理系统 PM 项目管理系统 SCM 供应链管理系统 CC 协同商务系统 BPM 业务流程管理 BI 商务智能 CMS 内容管理系统 KM/KBS 知识管理系统 电子商务系统 HRM 人力资源管理系统 ERP 企业资源计划 EAM 企业资产管理系统
升蓝首页 | 文档首页 | 产品首页 | 服务首页 | English Version | Big5 Version | 联系我们
Copyright © 1999-2008 深圳市升蓝软件开发有限公司  URL: http://www.hi-blue.com