SAN的远程连接技术纵览 - 将容灾系统扩展到“WAN”的范围
IBM 存储事业部 赵晓鹏
摘要
随着企业和组织的发展,数据量与日俱增。他们急需完成数据的存储,保护,备份和复制任务,并使这些任务的完成有尽可能高的性价比。于是,越来越多的企业和组织采用了SAN来完成这些任务。同时,他们的数据要求用户在任何时候,任何地方都可以访问到,不同地区可以做灾难备份,而SAN的光纤传输距离是有限的。为了解决这个问题,存储网络协会(SNIA-Storage Networking Industry Association)正在寻找新的方法来将SAN的数据传送到越来越大的范围。
一个比较好的解决方法是将分布在不同地方的SAN通过稳定而高速的线路连接起来。连接的方法目前有四种:用裸光纤(Dark Fiber)连接,通过同步的光纤网(SONET-Synchronous Optical Network)连接,通过ATM网络连接和通过IP网络连接。这几种方法各有适用环境,和特点,本文将一一讨论。
正文
SAN(存储区域网)概念的推出是在1998年。SAN是指通过一个单独的,专用的网络把存储设备和服务器连在一起,当有海量数据的存取需求时,数据就可以通过该网络在服务器和存储设备之间高速地传输。也就是说数据的传输有自己专用的网络,不再争用以太网的带宽。作为一种全新的存储理念,SAN在刚刚进入中国时受到了大多数用户的质疑,但是随后SAN以其优良的光纤网络存储架构,理想的处理海量数据存储和备份的能力和越来越多的基于SAN的存储应用方案,吸引了越来越多的企业级用户…据Gartner Group统计,2000年SAN在全球整个存储市场中占16%,而2005年将达到52%,从中国市场看,2000年SAN占整个存储市场的8%,而2005年将达到42%,SAN将会成为主流的存储技术。
这里我们简单介绍一下为什么要使用SAN并且认识一下SAN自身的限制。从网络发展的角度看,网络建成了信息传输、共享和处理的平台。网络技术的飞速发展,致力于提供更好的服务,更高的带宽和利用率;我们始终期待有更好的解决方案能够同时提供高度的扩展能力和更安全的环境。光纤技术证明了自身是更高效、更安全的网络基础。从企业的发展看,数据量爆炸性地增长,网络必须进一步扩展来满足以下需要:
-
需要高效安全的存储和备份
-
需要动态高速的数据迁移,例如远程灾备等应用
-
需要安全和高速的数据存放和读取
若使基于TCP/IP技术的网络实现以上要求,那么数据的迁移只能以异步方式进行,而且必须消耗大量的主机CPU资源,还会出现应用软件信息传输的中断和阻塞。因为以太网的设计是用来传输信息的,不适合大数据量的传送。SAN使用光缆或铜缆作为连接介质,建立了一个专注于服务器和存储设备的网络系统,采用串行的,无阻塞(non-blocking)的,专门为传输数据而设计优化的光纤通道协议(Fiber Channel Protocol)。该协议的传输速度快,延迟小,目前可以达到2 Gbps,不远的将来还会提升到10 Gbps;支持128MB的批量数据传输;能够承载SCSI,ATM,IP,802.2等上层协议,支持传统环境和应用。用光纤和光纤交换机作为连接方式的SAN,也叫SAN Fabric。在SAN Fabric网中可以容纳一千六百万个设备,同时光信号还具有传输距离更远,传输信号不易被干扰等优点。
但是光信号的传输距离有一定的限制。例如:短波光信号可以传输到500米的距离,而长波光信号可以传输到10公里的距离。这样每个SAN Fabric的覆盖范围是有限的,可以比喻为“孤岛”。(用铜轴作介质搭建的SAN的传输距离更近。)
那么SAN都能为我们做什么呢?
-
将数据备份到远程的磁带机上,免去了以前的人工搬运磁带机到本地备份。
-
在冗余配置中,将本地的数据做一个异地的实时镜像来保证数据的安全。
-
在块I/O级别(Block I/O)而不是文件I/O级别(File I/O)共享存储空间给远程的服务器。
-
实施远程灾备系统,保证自然灾害下或其它情况下的企业的不间断运转。
-
在分布式的系统中施行存储管理集中化,来优化人力和设备资源。
-
在服务器分布在企业整个范围的环境中动态分配存储容量。
在以上列举的多数情况下,都需要将分散在各个地区的“孤岛”连接起来,将光纤通道的数据包传输到更远的距离。“距离”是决定采用什么远程连接技术的关键考虑因素。其它需要考虑的因素包括:带宽,价格,性能和延迟。目前有四项比较成熟的技术,它们是:
-
光纤通道数据包经由裸光纤(Dark Fiber)或者多分复用(WDM,又称多波复用)设备
-
光纤通道数据包经由同步的光纤网(SONET)
-
光纤通道数据包经由ATM
-
光纤通道数据包经由IP网络(例如WAN)
单独或者组合地使用以上技术可以将SAN扩展到地球的任何角落。参考图一。(注:图中的WAN和MAN是借用了IP网的名词,表达的是范围和距离的概念。)
一.光纤通道数据包经由裸光纤或者多分复用设备
多分复用(WDM)是Wavelength Division Multiplexing的简写,它有很多分枝,例如密集多分复用(DWDM—Dense WDM)和粗多分复用(CWDM—Coarse WDM),还有FWDM…目前广泛使用的是DWDM。DWDM把不同来源的数据信号(80个或更多)放在一根光纤上传输。在数据源头,DWDM设备给每个数据信号分配不同的光波波长,到目的地后再通过DWDM设备将这些信号分离出来。它使服务提供商能够更快地为用户提供连接服务,服务商只需在已有的线路中增加一个信号即可。裸光纤(Dark Fiber,又称黑光纤)是指预先埋设的,还没有使用的,可以被租用的光纤线路。通常为了减少一次又一次铺设线缆所产生的成本,在一次施工中会铺设很多目前用不到的线缆,这就是裸光纤。用户可以租用裸光纤,并把它接到自己的光纤交换机上来实现SAN Fabric的远程连接。
裸光纤和DWDM的加入可以将SAN的连接距离扩展到:
-
1 Gbps的光纤连接--理论值120公里,实测值100公里
-
2 Gbps的光纤连接--理论值60公里,实测值50公里
如果使用信号放大器(Repeater)或者增强的长波光纤GBIC/SFP,该距离还可以进一步扩展。另外,随着光纤通道技术的发展,我们会突破120公里的限制的。这个距离的SAN Fabric也被称为城域光纤网 (MON—Metropolitan Optical Network)。见图二。
使用裸光纤和DWDM的优点是实施迅速,不需要数据帧的转换,数据传输速度快1 Gps或2Gps(与本地SAN网络速度一样),延迟小,可以做数据同步复制。
使用裸光纤解决方案的缺点是成本高,距离与其它三种技术比起来近,在用户需要的地方不一定有可用的裸光纤。
这里举一个应用IBM FAStT 900光纤存储服务器进行异地的Remote Mirror(远程数据同步镜像)的例子。拓扑图如下。
其中绿颜色的数据卷是数据源,红颜色的数据卷是目的卷,服务器向FAStT900的磁盘写数据时,首先写本地盘,然后通过裸光纤写到远程盘(中间速度没有下降,就像本地的SAN Fabric连接速度一样),当远程系统回应为写操作结束时才进行下一个IO操作。
 |