2023 re:Invent——从云计算到AI未来的一场全面重塑之旅

  • 来源:驱动中国 文:陈晨   
  • “重塑”一直是亚马逊云科技谈及的高频词汇,作为云计算的开拓者和引领者,十七年来,亚马逊云科技不仅一直通过最安全、最可靠的企业级的能力来赋能客户的应用,直到今天,其仍然拥有业界最广泛、最深入的功能。而在前不久举行的亚马逊云科技2023 re:Invent中国行城市巡展北京活动现场,亚马逊云科技大中华区产品部总经理陈晓建详细阐述了亚马逊云科技在面对利用底层技术重塑云计算和利用生成式AI重塑未来的宏图,让我们有理由相信这家以客户需求为出发点,持续引领科技创新的企业,继续探索用各种方法、更优化的方式找到解决客户痛点的最优解。

    亚马逊云科技大中华区产品部总经理 陈晓建先生

    四大维度重塑云计算版图

    重塑云计算并不只是一个单纯停留在宏观上的构想,即便是作为云计算的开创者,陈晓建也认为,云计算的重塑要围绕底层基础设施展开。

    在云基础设施方面,亚马逊云科技持续扩大全球基础设施的覆盖区域和增加数据中心的数量和规模,其全球基础设施横跨世界32个地理区域,目前数据中心数量比第二大的云提供商多三倍,服务多60%,功能多40%,即便冠绝产业,但亚马逊云科技依然宣布计划新增5个左右的区域,以此提升全球一致的体验,以及高可用和灾难恢复能力。

    不仅如此,此前亚马逊云科技公布的由数千颗近地轨道卫星组成的公共与专属一体化的高安全连线卫星⽹络Kuiper计划又有了新的进展,项目团队在11月份成功将首批两颗原型卫星送入了轨道,为整个部署完成了完美开端。

    重塑云计算的第二维度则在于存储,亚马逊云科技推出Amazon S3 Express One Zone的新服务。该服务通过专门的软硬件设计,大大提升了数据处理的速度,相比传统的Amazon S3标准存储,性能提升10倍。它还能以毫秒级的延迟处理每分钟数百万次的请求,且请求成本降低了50%。Pinterest就是这项新服务的受益者之一,其写入速度提升了10倍以上,并且机器学习驱动的视觉灵感引擎的总成本降低了40%。

    而在计算芯片领域,亚马逊云科技的Graviton芯片实现了重塑通用计算芯片环节,这款芯片已经被超过5万的客户所采用,为包括Top 100的EC2客户实现了降本增效。亚马逊云科技还推出新一代自研芯片Amazon Graviton 4,其性能相比Amazon Graviton 3提升了30%,同时数据库应用程序速度提升40%,大型Java应用程序速度提升45%。另外,Amazon Graviton3处理器的EC2 C7g、M7g、R7g实例在近期已经在亚马逊云科技中国(北京)区域和中国(宁夏)区域正式上线,为客户带来更出色的能效表现。

    在无服务器Serverless领域,亚马逊云科技通过大量全新的服务构建从底层极端到高端应用的重塑化。其中,Amazon Aurora Limitless Database简化了跨单台服务器读写吞吐量限制的扩展问题,实现了自动分布式分片,从而最大程度地提升了性能。新发布的Amazon ElastiCache Serverless则帮助客户在一分钟内创建高可用的缓存,并且可以实时进行垂直和水平扩展,支持复杂的应用程序,而且无需管理基础设施。此外,亚马逊云科技还推出了基于AI的扩展和优化功能的预览版Amazon Redshift Serverless,可以根据多个工作负载维度自动调整资源并执行优化操作,以达成预设的性价比目标。

    四个层面构建生成式AI重塑未来的愿景

    事实上,在今年十月下旬,亚马逊云科技专门召开了面向生成式AI构建者的大会,陈晓建在做主旨演讲时特别强调了亚马逊云科技在生成式AI方向上的赋能规划与普惠能力。短短两个月的时间,亚马逊云科技带着更多的全新产品、工具和服务,用端到端全栈持续投入,从底层、中间层和应用层以及数据基础四个层面来利用生成式AI重塑未来的愿景。

    据陈晓建介绍,在底层,亚马逊提供用于基础模型训练和推理的基础设施,强调自研芯片的创新。在会上,亚马逊云科技推出生成式AI和机器学习训练的专用芯片Trainium2处理器,其针对训练具有数千亿至数万亿参数的基础模型进行优化,相较Amazon Trainium 4倍性能提升,65 exaflops的按需超级计算性能。同时在全新的Amazon SageMaker HyperPod服务加持下,客户可大规模加速基础模型训练,缩短高达40%的训练时间,并可以确保持续数周或数月的训练不中断。

    亚马逊云科技的AI芯片应用不仅仅限于自有方案,其保持高度的开放合作态度,与英伟达展开“Project Ceiba”合作项目,并在亚马逊云科技UltraClusters技术的云AI超级计算机中首发引入NVIDIA Grace Hopper超级芯片,而且NVIDIA全新GH200 NVL32 的NVIDIA DGX云也将登录亚马逊云科技,其拥有1.6万个最新的GH200超级芯片,可提供高达65 ExaFLOPS的惊人算力。

    在中间层工具层,亚马逊云科技密集化的推出可以提供使用基础模型进行构建的海量工具。其中包括更轻巧的摘要型Amazon Titan Text Lite,参数更为规模化的Amazon Titan Text Express,

    多模态的Amazon Titan Multimodal Embeddings,以及面向图像生成的Amazon Titan Image Generator,所有工具完整化的构建了大模型应用场景和客户需求的模型形态。

    相比模型本身,最新推出的Amazon Bedrock则是中间层的主角,同时也是利用大模型构建和扩展生成式人工智能应用的最简单方法。其支持Anthropic Claude 2.1和Meta LLama 2 70B,可在高达200K标记上下文窗口中将开放式对话的错误陈述减少50%。同时强大而全面的功能为模型定制提供了全方位的训练和调试等功能,其不仅可以对已有的Amazon Titan Text Lite与Express模型进行持续预训练,同时利用定制化微调功能为客户制定特定的理解和输入输出,并利用RAG检索增强技术,带来知识库的检索生成,从而更好的运用本地内部数据源做出更精准的回答。

    除了Amazon Bedrock在应用集成中的代理能力,陈晓建还特别强调,Amazon Bedrock确保数据安全和客户隐私,任何数据都不会用于训练底层模型,所有数据在传输和静态时均经过加密,并且Guardrails for Amazon Bedrock的预览版,可以通过负责任的人工智能策略来保护生成式人工智能应用程序。

    在最上层的应用层,亚马逊云科技通过十七年的知识积累和经验训练,推出全新的Amazon Q,这是一个作为专为业务量身定制的、生成式人工智能工作助手,可以通过自然语言交互来快速获得答案。它既是满足开发者部署问题的技术专家,企业的业务专家,同时也是商业智能专家,和联络中心专家。

    陈晓建在介绍时举例时提到,在开发者场景中,开发人员可以询问Amazon Q任何有与产品相关的问题,结合Amazon CodeWhisperer,还可以实现一键实施的代码并提供代码转换功能,将应用维护和升级时的代码转换所需时间从几天缩短至几分钟。 

    当然,抛开三个层面框架,陈晓建认为,强大的数据基础对于生成式AI至关重要,一个强大的数据基础应该是全面的、集成化的,可治理的。亚马逊云科技提供全方位数据服务,满足各类数据处理需求。新推出的Amazon RDS for Db2提供更多数据库引擎和部署方式。Amazon OpenSearch Serverless则提供高性能的向量存储和搜索功能。此外,Amazon DocumentDB和Amazon DynamoDB新增向量搜索功能,而Amazon MemoryDB for Redis的向量检索功能也已发布预览版。为充分发挥数据价值,亚马逊云科技重视数据仓库间的集成,带来多项Zero-ETL集成预览版,以提供完整的业务视图。并通过新推出的Amazon DataZone AI recommendations预览版和Amazon Clean Rooms ML预览版,进一步丰富数据治理工具选择,在确保业务敏捷性的同时,强化数据的有效治理。

    “像云计算,卫星网络,生成式AI等所有复杂技术一样,虽然未来未知,但作为云计算的探索开创者,亚马逊云科技始终践行创新实践,为客户突破复杂技术,用重塑实现科技技术的普惠,用我们对底层技术的重塑,帮助客户持续重塑业务,这一旅程没有终点。”陈晓建在会上总结道。

    值得一提的是,据PitchBook的数据, 目前有超过1000家独角兽公司或估值超过10亿美元的创业公司,其中超过80%的独角兽公司都将工作负载运行在亚马逊云科技上。

    艾瑞咨询研究总监王成峰在会后也表示,亚马逊云科技在2023 re:Invent上持续推陈出、新升级迭代给他留下极为深刻的印象。其中不乏亚马逊云科技全面深化Serverless,推进数据库、数据分析、AI等全线产品的无服务器化,继续保持在云原生方面的领先布局,继续为生成式AI的发展提供强大能力支撑,不仅包括与英伟达等芯片商合作带来的更先进算力资源,也通过Amazon Bedrock产品提供精选多模型接入的能力平台,更加强调生成式AI领域的生态打造。


    评论 {{userinfo.comments}}

    {{money}}

    {{question.question}}

    A {{question.A}}
    B {{question.B}}
    C {{question.C}}
    D {{question.D}}
    提交

    驱动号 更多