WatchStor.com — 领先的中文存储网络媒体 | 51CTO旗下网站

方案案例 > 大数据 > 正文
Scale-out二级存储技术专家解读(下)
作者: IT专家网/齐轶文 2009-08-11 10:58 【watchstor.com】

在《Scale-out二级存储技术专家解读(上)》中,我们介绍了什么才是scale-out架构、它能解决哪些问题、目前有哪些产品。 这篇文章接前文,将继续为您介绍基于文件的备份解决方案、主动归档存储(active archives)等方案。

基于文件的备份解决方案

ExaGrid EX系列产品(基于网格的平台,采用了后处理重复数据删除方式和一个全球资料库)的关注重点是备份。这一平台支持RAID 6、NFS和CIFS NAS草案。像很多应用后处理方式的产品一样,EX系列维持了最新备份的最初形式,以支持超快的数据恢复速度,但是对所有之前的备份进行容量最优化。ExaGrid是本文所提到供应商中比较特殊的一个,其扩容二级存储平台可支持的存储容量<100TB,而其他供应商在关注的主要是大型企业存储系统。

FalconStor的VTL-SIR全球重复数据删除技术以确保远程的重复数据删除采用虚拟磁带库,并提供整个企业范围的重复数据删除技术。

NEC的HYDRAstor同时定位于备份和归档的采用,可利用在线的重复数据删除技术和全球资料库;支持RAID 6+和NFS/CIFS。Isilon IQ系列的定位更广,同时处理了主存储(大规模可升级主文件服务)和二级存储环境的备份和归档。Isilon的OneFS文件系统提供了单一的全球域名,一个可升级的RAID-6(可控制四个同步容灾,支持不同的标准协议(包括NFS, CIFS, HTTP, FTP, NDMP和其他协议)。

ExaGrid、Isilon和NEC都支持独立数据确认、快照、复制和智能化的个人管理(当增加了新存储容量后,可自动在新存储容量中平衡负载和/或容量资源。)

主动归档存储(active archives)

基于磁盘的归档是指由于实现了“主动归档(active archives)”并可提供响应更快,总拥有成本(TCO)却比磁带库低的产品。可扩容结构与存储容量优化计划(例如单实例或重复数据删除技术)相结合,形成了归档存储平台每GB最有竞争力的价格。

在归档系统中,一个给定的文件或许是企业最后的复件,因此数据的可靠性尤其重要。这就是为什么很多这一领域的供应商支持逻辑数据冗余技术(可维持三个或更多同步磁盘容错,而不会影响数据的可用性,同时可在不影响应用软件性能的情况下进行磁盘的重建。一般情况下,这些产品支持NFS、CIFS、WebDAV,和HTTP,尽管EMC的Centera(业内最初的内容寻址存储器、或CAS产品)以及HP的Integrated Archive Platform来支持自身的适宜API来进行下载数据归档。很多供应商承诺未来对SNIA eXtensible Access Method (XAM)(新的归档标准)的支持。


Permabit的数据中心系列企业归档是一个可扩容二级存储平台,关注的核心是归档

主动归档产品有两种形式:用于连接常用归档软件的整合硬件/软件的平台;仅利用软件解决方案的形式则利用commodity hardware创建了一个归档平台。

尽管Active Circle和HDS提供的NFS和CIFS接口和其他供应商相似,他们惟一的不同之处在于其提供了全球统一域名,而其他的供应商可提供单一、大规模的文件系统(1PB或更大)。

Active Circle、Caringo和Tarmin销售那些旨在与不同类服务器和存储硬件一起使用的软件,而EMC、HDS、 HP、Isilon、NEC、Permabit和Sun公司的产品被整合在硬件或软件平台。Sun公司的StorageTek 5800是惟一一个关注开放源码软件创建的归档系统。所有的供应商,除了Isilon和Sun,在有Active Circle、 Caringo、HDS和HP支持文件水平单实例的情况下,都支持某种形式的本地SCO技术,NEC和Permabit支持子文件水平的重复数据删除。一些产品提供了磁带输出容量,这或许会激起那些仍在利用存储体系中磁带的公司的兴趣。


NEC的HYDRAstor同时定位于备份和归档软件,用全球资料库实现了在线重复数据删除技术

从归档功能来划分有以下几类产品。来自如HDS、Permabit和Sun的产品关注归档环境,而来自如Isilon 和NEC的产品则是一般用途存储平台(用户可采用现有归档软件来归档和管理数据)。Isilon的系统可同时支持主存储器和二级从年初应用软件,并支持不同层级之间的自动文件转移。来自Active Circle、 CAStor、EMC和Tarmin的CAS产品如Active Circle、CAStor、EMC和Tarmin则配置了一个目标导向型方式(将文件视为目标,给每一目标配置惟一的识别符),基于每一目标相伴随的政策,实施归档管理任务(如审计、保留、加密以及分散)。

总结

Scale-out二级存储结构解决了单片存储结构存在的众多性能、容量、管理限制问题,将容量扩展到上百terabyte,且实现了自动容量供给。

而你或许对其价格充满惊喜:尽管入门级存储结构通常起始价格超过100,000美元,他们提供的每GB的价格却比传统存储结构低的多。假设SATA磁盘和数据精简比率为10:1到20:1这个范围(这对于配置了备份技术的系统中很容易实现),这些平台可支持三年低于1美元每GB的总成本,用于支持可用容量为100TB+的系统。

当前,大型企业的产品环境里运行着上千个此类平台,尽管支持不同类型的服务器和存储器解决方案正渐渐成为比整合硬件和软件CAS更新的产品服务。如果独立扩容的功能优势及自动供给这一管理优势、负载平衡这些新功能还不够有吸引力,那总成本优势肯定会让你心动。如果你在处理(或很快将处理)上百terabytes的任务,你应该考虑一下采用可扩容二级存储平台。

【编辑推荐】

  1. Scale-out二级存储技术专家解读(上)
  2. Isilon为其scale-out NAS 增加新企业级功能
  3. 浅析存储架构该如何适应云计算
  4. 详解NAS存储系统那个架构与存储的实现
  5. 虚拟化的iSCSI SAN:面向虚拟化基础架构的企业级存储
  6. 虚拟化技术冲击IT架构

标签:大数据 混合云 数据保护 云存储 服务器虚拟化 

了不起的IT经理
LecVideo
论坛与活动