三大数据中心热门架构 如何撑起未来五年企业云需求

  • 来源: 驱动中国   2017-04-18/22:43
  • 在本系列的上篇《先不听BAT高谈阔论 只看企业实际应用:数据中心架构如何演进?》中,我们已经详细的分析了为什么未来数据中心的发展方向是:简化、优化和弹性,也就三大数据中心架构:(集成)一体机、分布式存储和超融合基础设施做了简要的介绍。

    与此同时,我们也在上篇中就(集成)一体机做了深入浅出的介绍,那么在接下来的文章中,我们则讨论数据中心的另外两个架构趋势:分布式存储和超融合基础设施。

    分布式存储 vs 传统存储 是怎么胜出的?

    前面我们说过,分布式存储近年来正成为企业存储的主流选择,越来越多的企业级数据中心用户开始尝试使用以工业标准服务器为基础的分布式存储架构,取代价格昂贵、架构复杂、系统封闭且性能存在瓶颈的FC SAN或企业级NAS系统。

    与叶磊在前述文章中提到的“将互联网的经验应用于传统数据中心用户”一样,分布式存储兴起于规模扩展迅速、对存储系统弹性要求极高、偏爱开放的标准化系统的互联网客户,可以说,分布式存储在传统企业级数据中心的应用,与互联网到传统企业的技术架构分享不无关系。

    无论是否熟悉这一过程,很多人对分布式存储都有着这样的印象:基于x86工业标准服务器、支持高性能存储、支持块级或文件和对象级存储、存储资源池可以达到PB甚至EB级别、性能和容量可以按需弹性扩展,此外,分布式存储在高可用性、高可靠性上也得到了非常大的关注和认可。

    反观传统存储,专有的硬件设备导致了开放性极差的封闭平台;纵向扩展导致系统的性能和容量被大幅度的限制;传统的RAID数据保护技术效率低重构慢;即使是双活架构,其可靠性也往往受限于单点故障,继而对故障期间的性能承载乃至整个系统的可用性造成影响。

    不仅如此,传统存储往往来自于老牌外企,比如IBM、HPE、DELL、EMC、HDS、NetApp等公司,技术架构封闭导致的专业人员管理维护要求,成本居高不下。

    但这些问题只是分布式存储胜出传统架构存储的一个方面,是从原生的架构特性和市场供应商的角度来考虑的,就分布式存储来说,它能够取代传统架构存储的另一个重要原因,是在这一软件定义存储的时代,分布式存储更加强调存储系统的软件功能、软件特性和软件开放性,并以此将存储(软件所提供的)功能,更好地交付给企业业务应用。

    首先,在软件定义存储的思路下,分布式存储的存储软件和存储硬件更进一步分离,我们可以以天玑数据海量分布式存储PhegData X系列的架构来对此进行一个简单的分析:

    1、PhegData X的架构分为四层,即设备层(HDD、SSD)、引擎层、服务层和接口层,除设备层外,其他三层都是分工合作却又分工明确的存储软件层;

    2、引擎层提供了基础的存储功能,包括DHT算法、分布式集群通讯、强一致性和集群自愈等功能;

    3、服务层则以软件定义存储的思路,将数据平面和控制平面分割开,提供多副本、分级存储、精简配置、克隆、快照以及SmartCache智能缓存等高级存储功能,确保存储服务的有效、可靠和高性能;

    PhegData X系列架构视图

    其次,PhegData X存在多种不同的保证存储效率、性能的软件功能,比如虚拟OSD技术,这一机制将原本固定划定的不同容量(HDD)的OSD,转变为哈希环架构的实际节点为4GB容量的vOSD,确保同池中不同容量磁盘空间使用率均衡一致,保证不同容量磁盘的均匀池化;

    同时,PhegData X在软件层面展现了天玑数据长期以来对自主创新、自主研发的坚持:自主研发的灰度缓存技术改变了传统算法无法防御扫描式读写的存储风险;自主研发的私有协议专为Scale-Out(横向扩展)分布式存储系统设计,最大并发度可达128个IOS同时响应。

    第三,在I/O方面,PhegData X以大资源池集群的概念,通过P2P集群级共享IO向应用提供I/O性能,而非采用LUN内共享I/O的方式,相比后者将LUN与应用一一对应(甚至是锁定),只能提供峰值有限的I/O的设计相比,各个节点的利用率不仅更高,而且可以在某个应用的峰值来临时,集中整个资源池集群的I/O予以应对。

    此外,与Oracle的FS1闪存存储系统类似,PhegData X为保证高优先级业务应用的QoS,而采用了基于不同应用的访问性能控制,比如面向核心业务Oracle数据库,PhegData X将提供10万IOPS和1Gbps,文件服务则提供1万IOPS及500Mbps带宽,这确保了高优先级应用在IOPS性能和带宽方面的需求。

    分布式存储在未来存储架构的竞争中胜出基本上已成定局,在部分数据中心内,受限于业务原因,自然传统架构存储还有一定的存在需求,但更加开放、更加强调软件功能、将存储和控制平面分离的分布式存储,显然会在越来越多的数据中心得到应用,但需要注意的是,软件功能、系统性能和架构设计这三方面的考量缺一不可。

    当然,在一些数据中心,计算和存储也在发生着融合,在这一类企业的业务应用中,计算和存储的发展是对应成正比的,既需要快速增长的计算性能,也要快速增长的存储性能和容量。

    事实上,这一需求广泛存在于企业级数据中心中,但互联网企业对此的需求在更早期的时期被激发出来,主要体现在随着快速发展,不能以细颗粒度的方式满足计算和存储的同步增量——一边增加计算、一边升级存储系统的做法,对互联网企业来说太过麻烦也太过耗时,这也是为什么以Google为首的超大型互联网用户开始寻求一种新的以“Brick(砖块)”形式进行扩展的数据中心架构,这就是超融合。

    业务变得快客户要求高:不考虑下超融合?

    阿里巴巴、腾讯和百度的数据中心与传统企业数据中心最大的区别是什么?是自动化的运维?还是大量的定制化硬件?亦或是整齐划一的布线和机柜?从某种意义上来说,由于互联网公司业务的变化很大,弹性幅度很大,先进的互联网数据中心和传统企业数据中心的最大区别,在于前者提供的是资源服务,后者提供的是设备。

    从硬件和架构层面来说,云数据中心不仅能保证性能,而且它是采用开放的架构、横向扩展、软件定义的思路建设起来的,但更关键的是,它通过将硬件资源服务化,提供按需消费的、弹性扩展的以资源服务为核心的数据中心供给模式,数据中心的资源供给不再是几个处理器、几块硬盘、几个10GbE接口,而是多大flops的计算量、多少IOPS的存储性能或是多少TB的存储容量,甚至于更进一步,提供的是“支持多少个企业邮箱的计算和存储性能”或是“支持多大规模日交易量的计算性能”。

    数据中心向提供资源服务为核心的转变,首先影响的就是数据中心的底层架构及其可扩展性,在新的设定下,计算、存储和网络性能应当尽可能的标准化、模块化及可量化,比如说EMC在2015年收购的Virtustream就是这样思路的产品:

    这家公司一项核心的云资源管理专利技术被称为“Virtustream μVM”,该公司把这个μVM的颗粒度定制为:200MHz的CPU、768Mb内存、40IOPS和2Mb/s的网络带宽,μVM作为一个细颗粒度的标准资源划分单位,以其很小的资源调度颗粒度,不仅几乎没有资源浪费、调度速度更快。

    在硬件架构层,同样的架构转变正是超融合的出现,超融合架构借助建立了更加简单、可扩展、标准化、模块化的基础架构,“以提供一组随时间增长的开放式服务”。

    同样以天玑数据的PriData超融合私有云平台为例,超融合架构保证了硬件供给,甚至是硬件资源(计算资源、存储资源)供给的标准化和模块化,企业级数据中心的管理者能够很清晰地知道,多少个“砖块(Brick,即一个超融合服务器单元)”可以满足多大规模的企业业务应用需求,服务变更效率、资源利用率得到提升的同时,给软件运维、支持业务应用、集中管理、智能规划、自动运维提供了极好的支持。

    但标准化不意味着单一化,像是PriData,提供了P系列和Q系列两个不同系列的节点,前者每机箱1个节点,面向对性能要求更高的企业用户,后者每机箱4节点,针对对密度有更苛刻要求的企业用户,不仅如此,PriData还提供支持GPU“加持”的图形渲染节点,并满足异构hypervisor的管理。

    对于超融合架构的适用领域,叶磊特别强调,除了目前普遍应用于新建及扩容改造数据中心、面向应用开发及测试的需求之外,“超融合可以用于构建企业级的私有云、公有云、桌面云及容器应用,也适用于核心业务交易和容灾/双活数据中心,超融合架构是企业业务需求逐步变化下,对现有成熟架构的演进,而不是一种新的未经验证的架构。”他认为,未来超融合架构的市场前景将大幅度超过现在的预期,“毕竟这一架构满足了高性能、高扩展、高可用的需求,而且能够帮助企业用户实现成本降低。”

    提到未来数据中心的演进,叶磊表示,(集成)一体机、分布式存储和超融合基础设施毫无疑问是下一阶段云数据中心的核心设施,这三者在架构上都改变了原有专有系统的封闭性、以对硬件的标准化和优化降低了硬件架构的复杂性,并更加注重软件在云数据中心及其基础设施中所起到的关键作用。

    但架构仍然是在进化的,从传统SAN架构的云计算架构,转变到如今硬件简化、软件定义的云数据中心,乃至超融合架构为核心的超融合云架构,仍然不能够满足企业级数据中心管理者们对数据中心的所有需求,“下一步,智能全融合云架构会是发展的方向”。

    对于什么是“智能全融合云架构”,叶磊和天玑数据的愿景是通过对运营数据的全采集,通过机器学习实现以运营数据为基础的智能决策的数据中心管理层,同时,在数据中心内针对一般性应用和数据库核心应用,构建融合节点和融合数据库节点,分别向上层提供大虚拟化层和DBPaaS(数据库PaaS层)的资源供给(包括虚拟机、物理机、容器等计算资源,文件、对象、块等存储资源,IP、安全、网元等网络资源)。

    所有的资源可以在智能决策平台的调度下,以资源服务的形式,向上层的云平台用户(多租户)实现按需供给、按需付费,实现“智能+融合+按需”的数据中心建设。

    当然,想要实现这些愿景还是要经过一段时间的,但对于未来的数据中心企业用户来说,这一愿景的实现更为贴切其企业业务应用的实际情况,这其中既汲取了百度、阿里巴巴、腾讯等大型互联网公司的架构设计和实践经验,也是对传统企业数据中心业务核心需求的适应,想必这必须是那些在座的企业级用户最喜欢听的演讲内容了吧?


    评论 {{userinfo.comments}}

    {{money}}

    {{question.question}}

    A {{question.A}}
    B {{question.B}}
    C {{question.C}}
    D {{question.D}}
    提交

    驱动号 更多