中国IDC产业年度大典指定存储网站 中国IT实验室旗下网站
存储世界
 热门搜索:SAN 虚拟化 RAID 容灾 ILM 分层存储 iSCSI SAS
搜索:
 您现在的位置: 中国IT实验室 >> 存储 >> 存储网络 >> FC SAN >> 正文
A-SIS:重复数据删除应运而生
来源:ChinaItLab 时间:2007-12-28 保存本文 作者:佚名 收藏本站

    大家都知道,存储系统的容量正在以惊人的速度增长。在过去的10年里,NetApp 提供的存储系统容量从数十GB发展到数百TB,足足翻了10,000倍!但是,多数企业发现它们对存储的需求甚至增长得更快,——除了存储所有这些数据的磁盘或磁带的成本外,——数据中心空间和电源也变得越来越昂贵。因此,它们的重要目标之一就是尽可能高效地使用存储。

    从存储数百个Snapshot副本仅需极少磁盘空间的独特的Snapshot技术,到允许系统管理员在运行时扩展和设定卷的 FlexVol技术,NetApp一直是高效利用存储的行业先锋.

    五月份,NetApp宣布了一种新的重复数据删除技术,能够大大提高指定磁盘空间可存储的数据量:高级单实例存储(A-SIS) 重复数据删除。NetApp NearStore R200和NearStore on FAS系统均可使用该技术(免费!)

    重复数据删除能以单个共享数据块为参考寻找相同的数据块并将其替换,从而提高效率。相同的数据块可能属于多个不同的文件或LUN,或者可能重复出现在同一个文件中。A-SIS重复数据删除是NetApp WAFL文件系统不可或缺的一部分,该系统管理NetApp FAS系统上所有存储。因此,不管您运行何种应用程序或如何访问数据,重复数据删除都在"后台"运行,并且开销很低。

    您可以节约多少空间?这取决于数据集和它所包含的重复数据删除量。以下是NetApp客户实现节约的几个示例:

  • 一家全球性石油和天然气公司为其主目录存储节约了35%的空间。
  • 某投资管理公司减少了90%的VMware映像备份副本。
  • 某个测试和测量仪器制造商在日常数据库备份方面节约了98%的空间。

    A-SIS 重复数据删除如何运作

    实质上,A-SIS重复数据删除采用老式的计算机科学技术-参考计算。以前,WAFL仅跟踪数据块是否在使用。借助A-SIS重复数据删除,它还能跟踪有多少在使用。在目前的实施中,不同文件或同一文件中的单个WAFL块可参考多达256次。文件并不"知道"它们之间在共享数据-WAFL内的簿记会在后台管理这些细节。

    WAFL如何确定哪两块可以共享?答案是WAFL会为每块计算出"指纹",这是块数据的哈希。具有相同指纹的两个块即可用于共享。

A-SIS:重复数据删除应运而生

    在卷上启用A-SIS重复数据删除后,它会为备份卷中所有正在使用的块计算出一个指纹数据库(此过程称为"收集")。完成初步设置后,卷即可用于重复数据删除。

    为了不减缓普通文件操作,副本搜索将作为一个单独的批次处理来完成。由于文件系统会在正常使用过程中进行更新,WAFL将创建描述其数据块更改的日志。该日志不断累积,直到出现以下某种情况:

  • 管理员发布 sis start 命令
  • sis config 计划中指定的下一次发生
  • 日志更改超出了预定的阈值

    这些事件中的任何一件都会触发重复数据删除过程。启动重复数据删除过程后,A-SIS 会使用变更块的指纹作为密钥来给日志排序,然后将排好序的列表与指纹数据库文件合并。一旦两个列表中出现相同的指纹,则可能有两个相同的块可折叠成一个。这种情况下,WAFL 会弃用其中一个块,并用另一个块的参考将其替换。因为文件系统时刻在变,除非两个块确实仍在使用并且含有相同的数据,否则我们当然可采取这一步骤。

    A-SIS 重复数据删除实施利用了 WAFL 的某些特殊功能,从而使重复数据删除的成本降到最小。NetApp 很早以前就发现,要确保存储在磁盘上的数据的完整性,应该采用皮带与吊带式 (belt-and-suspenders) 方法。(事实上,最好有几双吊带。)因此,磁盘上的每个数据块都通过校验和得到保护。

    A-SIS 使用该校验和作为它的指纹。由于无论如何都会计算指纹,相当于"无消耗",因此不会给系统增加任何负担。且由于 WAFL 绝对不会覆盖正在使用的数据块,因此在闲置数据块之前,"指纹"将保持有效。A-SIS 重复数据删除与 WAFL 的紧密集成也意味着更改日志是一种高效的操作。其结果是 A-SIS 重复数据删除可用于广泛的工作负荷,而不仅是用于备份,其它重复数据删除实施的情况也是如此。

[1] [2] 下一页

【责编:Chuan】
相关文章
重复数据删除不足之处
中立的重复数据删除产品评测出炉
飞康向NAS备份中添加重复数据删除功能
重复数据删除和VMware虚拟化完美组合
重复数据删除能否由次级转移到主存储?
SEPATON承诺DeltaStor重复数据删除比率
五大技术主导2008年存储市场
最新文章
·盘点硬盘领域的九大基础技术
·存储讲堂:详解四大RAID存储
·剖析文件虚拟化以及四种SAN虚拟架构
·深度解析RAID类型 全面透视RAID 10优
·磁盘阵列三大关键部件
·全方位解析虚拟带库优势特点
·云存储应该用在什么样的业务系统中
 文章评论
 精彩友情推荐
·Asp源码 PHP源码
·CGI源码 JSP源码
·建站书籍教程
·服务器软件 .net源码
·建站工具软件
·IDC资讯大全
·机房品质万里行
·IDC托管必备知识
·全国IDC报价
·网站推广优化
行业信息关注  

HDS存储研发体系与

2008电脑展盘点:
·赛门铁克发布FileStore云存储平台
·HDS发布Content Platform 瞄准云
·企业考虑基于云的电子邮件管理服
·美光发布首款SATA 6Gbps SSD明年
·唤起儿时的记忆  迪士尼移动存储
·迪士尼青睐国内消费电子市场  力
特别推荐  
08版网络测试工具新鲜出炉
《IT实验室周报》征稿启事
中文Traceroute,路由信息一目了然
北大青鸟IT教育求学培训全攻略
固态硬盘--未来存储之星
中文授权Alexa网站排名查询
存储技术  
  现在我最关心的就是光纤网络的传输质量、有效传输距离以及数据传输速率等性能指标,因为,我们的机房和设备都分处两地...
·盘点硬盘领域的九大基础技术
·存储讲堂:详解四大RAID存储
·剖析文件虚拟化以及四种SAN虚拟架构
·深度解析RAID类型 全面透视RAID 10优势
·磁盘阵列三大关键部件
·全方位解析虚拟带库优势特点
·云存储应该用在什么样的业务系统中
·全磁盘加密:辨别该做的和不该做的
产品专区  
·System Storage DS8700实现150%性能提升
·中小企业存储产品与方案应用导购
·Adaptec 5445Z SAS&SATA阵列卡图赏
·关于云存储需要弄清的五大问题
·深入解析SSD中MLC与SLC的性能差异
·多重虚拟机备份流化减少RTO
·普通硬盘vs固态硬盘——SSD值那么多钱吗
·固态硬盘评测:80GB Intel X25-M
·MLC性能直逼SLC!海盗船P256 SSD测试
·最大容量500GB 日立P7K500系列硬盘解析
 Chinaitlab Group 旗下网站:  中国IT实验室 | 中国IDC圈 | 存储世界 | 数字网校 | 21世纪IT人才网
关于我们 | 广告服务| 成功客户 | 合作媒体 | 网站历史 | 联系我们 | 招聘信息 | 免责声明 | 社区之歌
Copyright © 2001 - 2007 All Rights Reserved
京ICP备09039051号