做云计算时代的数据库 Amazon Aurora成就数据之美

  • 来源: 驱动号 作者: 科技talk   2018-11-09/07:54
  • 19世纪,爱马仕还是一家专门制作各种精美马具的作坊,但到了20世纪,汽车逐渐取代马车,爱马仕不得不从马具转向皮具,从而成就了这一世界级奢侈品品牌;1975年,柯达研发出世界上第一台数码相机,但由于担心胶卷业务受到影响,柯达一直没有大力发展数码业务,等到数码时代真正到来,柯达也从胶片巨头走向破产重组。

    从爱马仕和柯达的经历可以看出,一个时代的变迁往往会带来整个社会翻天覆地的变革:汽车时代,再好的马具也没有市场;数码时代,再好的胶卷也无用武之地。只有那些顺应时代变革的企业,才不至于像恐龙一样灭绝。

    在科技业,时代变迁带来的剧变同样十分明显,从传统IT时代到云计算时代,数据不再只是沉睡的宝藏,数据库的作用和价值正变得尤为突出。正如亚马逊CTO Werner Vogels所说:数据是大部分企业业务的核心,而使业务独特的原因所在,是所拥有的数据、数据的质量以及如何利用这些数据,这使得数据存储越来越重要,宝藏就在数据库中。

    真因为如此,顺应云计算时代而生的Amazon Aurora成为AWS公司历史上发展最快的服务,在过去两年间,AWS通过其数据库迁移服务迁移了超过60000个数据库。这样大规模的数据库迁移不仅意味着数据库市场在悄然变化,更进一步表明了企业在对待数据态度的巨大转变。

    这些企业为什么要做数据库迁移?

    Autodesk是一家3D设计、工程和娱乐软件领域的领先企业,如今,Autodesk在Amazon RDS上运行的MySQL托管数据库和在Amazon EC2上托管的自我管理的MySQL数据库已成功迁移到Amazon Aurora。Autodesk之所以做出这样的选择,也是迫于无奈。

    Autodesk Access Control Management(ACM)应用程序是在云中诞生的,对可用性、可扩展性和性能都有着较高的要求,不论在容量需求上还是在延迟实践上,MySQL都无法满足ACM所带来的挑战。与其削足适履,倒不如选择一个可替代方案。

    在向Amazon Aurora迁移后,Autodesk发现,ACM应用程序的扩展性提高了20倍,应用程序的响应时间缩短了2倍,并且Aurora支持的数据库连接数量增加了7倍。不仅如此,这一迁移的亮点还在于CPU利用率比类似大小的数据库实例减少了10倍,从使用MySQL时高达100%的峰值水平降至使用Amazon Aurora后不到10%的水平,为数据库跟随ACM的扩展增长留下了空间。

    MAGASeek是一家日本电子商务网站,不仅经营着来自2000多个国内外品牌的男装和女装,还在为制衣企业提供从建设电子商务网站到运营等各个阶段的全面服务。为了应对激烈的市场竞争,MAGASeek需要以最少的成本快速构建具有高度竞争力的网站。

    但依托传统的本地IT基础设施,MAGASee建成一个电子商务网站需要两个月时间,而老旧IT基础设施效率地下、升级费用也十分昂贵。为此,MAGASeek开始寻求将本地基础设施与云端相结合,通过混合解决方案应对服务器负载的突增;不仅如此,MAGASeek还考虑将企业的核心数据从原来的Oracle数据库迁移到Amazon Aurora上,以应对系统负载的突增。

    在AWS的帮助下,MAGASeek只用了两名工程师就完成了迁移工作,通过这一迁移,MAGASeek批处理作业的能力翻了三倍,每秒的客户端请求处理数超过此前应用Oracle数据库时的最高值,而数据处理的速度也更加迅速,充分保障了公司的业务开展。

    Innovid作为一家视频营销企业,近年来随着客户群体和数字视频广告预算的不断增加,公司业务持续扩展。为了确保在多个地区提供能够按需拓展的一致服务,Innovid必须具备一个高度可用的弹性IT环境,最终,Innovid决定将自己的基础设施迁移到云端,并将数据从MySQL数据库迁移到Amazon Aurora上。

    2012年,Innovid每个月的视频广告量大约在3.6亿条左右,时至今日,Innovid的处理能力已经超过150 亿条。“得益于AWS,我们现在所能处理的广告量是五年前处理量的40倍。”Innovid高级工程副总裁Yuval Pemper表示,“迁移到Amazon Aurora是我们做过的最明智的决策。它提供了业绩,并帮助我们免去了一大堆耗时的手工操作任务,例如重复工作和备份工作。”

    从上述几家企业数据库迁移的心路历程来看,在数据爆炸式增长的今天,传统的数据库已经无法满足企业业务的实际需求,云计算时代还是要用全新的数据库系统才行。这一点与计算能力颇有相同之处:过去,企业为了应对业务峰值,只好构建满足业务峰值的计算能力,尽管许多能力平时都处在闲置状态;现在,面对业务峰值,企业则可以通过云的方式,对计算能力进行弹性扩容,从容应对的同时降低企业整体成本。

    作为新一代数据库 Amazon Aurora究竟有哪些优势?

    作为亚马逊为云打造的一款能兼容MySQL的新一代企业级数据库,Amazon Aurora基于云设计了一套全新架构,使数据库的性能大大优化,其速度最高可以达到标准MySQL数据库的五倍、标准 PostgreSQL数据库的三倍。而且,Amazon Aurora不仅拥有高端商业数据库的性能和可用性,还拥有非常灵活的横向及纵向扩展能力,具有开源数据库的简单性和成本效益。

    这样的数据库一定很贵吧?事实并非如此,其成本仅有商业数据库的1/10而已。具体来说,Amazon Aurora在如下几个层面有着较为突出的优势:

    1、在兼容性上,Amazon Aurora能很好地兼容MySQL和PostgreSQL的关系数据库。其中,当前使用MySQL5.6和MySQL5.7的用户,无需修改应用的代码、应用程序、驱动程序和连接工具,就可以像访问原数据库一样访问Amazon Aurora。有版本差异的数据库,也只需要进行数据库升级或者进行少量代码、应用的修改就可以将系统迁移到Amazon Aurora。

    2、在高性能和可扩展性上,Amazon Aurora作为一个集群数据库,可以包含一个主节点和多个只读节点,当用户访问量增加时,企业可以根据需求动态增加只读节点,从而扩展数据库的读的能力,它最多可以跨三个可用区,添加15个低延时(一般延时为毫秒级)的只读副本,这意味着你的数据库可以是一个16个节点组成的集群,大大提高了数据库的处理能力。

    3、在数据的持久性上,Amazon Aurora数据库的存储是以SSD硬盘为基础、能被 Aurora 数据库内多个节点共享的虚拟集群卷,这个集群卷可以跨3个可用区。这意味着企业将数据插入到Aurora数据库时,数据会跨3个可用区自动复制数据的6个副本,从而在出现硬盘故障或者数据中心灾难时可以自动恢复,从而保障数据的高可用。

    4、在数据的访问上,Amazon Aurora数据库的访问一般通过集群终端节点和只读节点,这与普通的MySQL类似,其中集群终端节点会访问数据库主节点进行读写操作,只读节点通过负载均衡的方式访问多个只读节点,以减轻每个节点的压力,如果主节点出现故障,只读节点会自动提升为主节点。而Amazon Aurora的多个节点可以位于云上不同的可用区,这进一步提升了数据库的访问能力。

    5、在数据库架构上,传统数据库是将数据库实例和存储集成在一起,很难横向扩展,性能也不易改善;而Amazon Aurora是基于云设计的新一代架构,使用的是计算和存储分离的方案,在高可用、存储、日志、连接等多方面有优化。这样一来,计算层和存储层之间传输的是日志而不是更改的数据,因此计算和存储层之间的网络流量大大降低。

    6、在数据库维护上,Amazon Aurora是一种完全托管的数据库,管理员无须管理数据库的操作系统及操作系统上软件的安装等,亚马逊自动定期将数据库数据及日志备份到Amazon S3存储,从而使数据库管理员在需要时快速恢复数据,管理员可以很容易将数据库恢复到5分钟前的任何状态。Amazon Aurora还提供了回退功能,如果用户出现了误操作,管理员可以将数据库回退到3天内的任何一个一致状态。这些无疑大大减轻了管理员的工作压力。

    从上述几大特点我们可以清晰看出,Amazon Aurora的优势着重体现了对云计算时代企业应用的关注。如果用一个词来形容,Amazon Aurora更像是一个“云原生”的数据库,而不是传统数据库的优化和演进。这估计也是Amazon Aurora为何成为AWS公司历史上发展最快的服务的核心所在。

    数字经济时代 数据库将全面释放数据价值

    与很多人将数据看作是一种资源、是“新石油”不同,《大数据时代》作者、被誉为“大数据之父”的维克托•迈尔•舍恩伯格认为,数据不仅是“石油”,还是“新货币”。因为货币有一种很重要的职能是像润滑脂一样让市场运转,而这种职能正在被数据所替代。

    事实上,在数字化转型已经成为时代主旋律的今天,数字经济越来越成为世界经济发展的新动能,而数字经济赖以发展的基础正是数据。如今,全球超过80%的企业都在将数字化转型作为最重要的策略,在中国,金融、零售行业数字化转型已经较为成熟,政府、制造、医疗、交通行业数字化转型正在加速推进。

    在这一过程中,云计算作为企业实现数字化转型的基础,也备受追捧。来自IDC的预测显示,到2021年,80%的应用开发部署都将基于云端,80%以上的500强企业将通过行业云向客户提供数字服务,企业在云服务以及云驱动硬件、软件和服务上的开支将翻倍超过5300亿美元,而其中超过90%来自多云环境。

    在云计算快速普及过程中,数据库经常会成为性能的瓶颈,传统数据库的横向扩展能力非常差,很难适应云时代的发展。除此之外,物联网、人工智能等新技术的快速发展,也要求数据库深入到软硬件一体化设计和智能化运维与内核优化等新兴技术的应用中。

    不过,数据库发展所面临的压力不仅仅源于云计算等新技术的应用,同样来自数据的爆炸式增长。根据IDC的预测,到2025年全球数据将增长到163ZB,这个数字是2016年的10倍。这无疑给数据存储和访问带来了前所未有的新挑战,必须用新的数据库技术来应对。

    对于AWS来说,用户的需求除了来自云计算层面之外,还有来自数据库层面的需求。正因为如此,AWS通过打造Amazon Aurora,并希望给企业提供了一个高可用、高可靠且成本较低的新型数据库服务,从而改变企业需要花很多人力、物力、财力来运维、运营或者开发数据库的状况,让企业能够将更多地精力投入到业务创新上。

    截至目前,Amazon Aurora数据库已经在海外市场应用了三年,经过无数客户的测试及生产环境的验证,AWS也根据用户的需求对其进行了持续的优化。如今,随着云计算在各行各业的深入应用,Amazon Aurora逐渐成长为一款成熟、稳定、性能优异的企业级数据库,并受到越来越多企业客户的青睐。

    今年8月,Amazon Aurora在由西云数据运营的AWS中国(宁夏)区域落地,正式加入到助推中国企业数字化转型的行列中来。在中国企业纷纷上云的今天,来自对于云原生数据库的需求也正在积聚并即将爆发,这无疑是一个前所未有的新机遇。近年来,Amazon Aurora在数据库领域的技术和实践积累,已经为迎接这一新机遇做好了准备。


    评论 {{userinfo.comments}}

    {{money}}

    {{question.question}}

    A {{question.A}}
    B {{question.B}}
    C {{question.C}}
    D {{question.D}}
    提交
    文章数: {{userinfo.count}}
    访问量: {{userinfo.zongrenqi}}

    驱动号 更多