今天晚上熬夜不是为了看伊朗对美国的比赛,而是为了AWS re:Invent 2022大会的一个分享:凌晨00:30由AWS CEO Adam Selipsky的Keynote。re:Invent是AWS最盛大的年度大会,面向AWS的开发者、生态企业、客户等,会发布未来一段时间内最重要的产品与特性。
好了,已经很晚了,直奔主题,来看看关于数据库,AWS CEO都说了些什么。
数据库与分析产品是整个Keynote的第一部分。首先提到的产品发布是 Opensearch Serverless,不过Adam并没有详细介绍该产品,而是强调,整个的数据分析产品体系全面实现了Serverless。
在介绍Integration部分的时候,Adam发布了Amazon Aurora 与 Redshift的无缝数据集成(Aurora zero-ETL integration with Redshift)。使用该特性:
Adam介绍另一个Integration特性是:Redshift支持Spark。使用该特性,可以在EMR等平台上,直接运行Spark Queries对Redshift的数据进行计算,无需做任何的移动数据,支持多种语言(Java Python R等)。
整体上,Keynote大致分成了几个部分:AWS整体价值概述、在线数据库、分析服务与产品、AI平台、集成产品与平台企业用户、权限、安全、合规管理、计算、容器、其他(供应链产品、生态体系产品、行业产品等)等。在其他部分也还有很多的产品发布,这里不一一详述,感兴趣的可以关注re:Invent官网:https://reinvent.awsevents.com 。
整体上,数据库部分并没有特别大的发布。从平时的产品发布节奏来看,AWS在数据库方向的主要包括了Serverless(或者与Serverless生态的集成)、Graviton数据库实例的发布等。这次会上,CEO把在线数据和分析数据的集成单独拿出来讲,还是略感意外的。
当下信息技术的大背景依旧是数字化,数字化带来的海量数据以及海量计算能力的需求依旧是当前企业面临的主要挑战之一。一方面,AWS在持续的、一致的通过Serverless技术去改进数据处理的模式,通过Serverless的模式去降低价格成本以及维护成本。所以这一次,发布了Opensearch Serverless之后,整个分析产品体系都实现了Serverless的支持属于预料之中。
另一方面,AWS也注意到ETL的困难已经在阻碍用户的数据价值发现,所以这次大会上提出了“A zero-ETL future”。同时,基于此理念(当然关系可能是反过来的),发布了“Aurora 与 Redshift无缝的数据集成”(Preview)、“Redshift支持Spark功能”(GA)。
个人认为,数据流动困难确实是当下企业数据价值发现的一个大的绊脚石,不过,云厂商发布的集成方案,只能是在云厂商内部,虽然可以解决局部的问题,但是,对于实际用户来说,其数据分布可能更加广泛,可能分布在多个云厂商、或者本地IDC、或者云厂商的自建环境(EC2、ECS等)等。另外,数据存储与数据分析产品的发展都非常快,远不是局限于在某个云厂商的一方产品。总的来说,通过发布一些产品的内部集成能力依旧还是很难解决当前企业的数据流动问题的。就像CloudFormation和 Terraform的关系。
方便理解,re:Invent大会之于AWS相当于云栖大会之于阿里云,Oracle Open Wolrd之于Oracle。在这个会上,AWS会宣布最新的产品发布和特性。从这里也通常可以看到AWS宏观上的产品规划方向。另外,这是一个盛大线下的大会,在美国的Las Vegas举行,今年大会号称约有5万人在线下参加。
2018年11月份的时候,在前东家的支持下,与斗佛一起去参加那一年的re:Invent。虽然2015年,之前也参加过OOW,也参与和组织多次云栖大会,不过还是被re:Invent震撼了。
大会确实非常盛大,参加的开发者、生态企业非常多,即便是在Las Vegas,也没有一个酒店或者场所容纳这么多人,所以,大会在Vegas城区的数个大型酒店同时举行。不过,也因为酒店之间都是有一定距离的,所以,有时候需要听的session分布在不同的酒店,就会比较麻烦。当时的大会的主题是“Build”,可见,这是一个面向开发者的大会。除了主题分享,还有很多小型的workshop、培训认证、生态分享等,整体上,感觉对开发者比较友好,略微有趣,比较务实。另一个务实的体现,就是演讲内容很务实,CEO(当时是Andy Jassy)的Keynote也是非常的“干”,上来就讲技术、讲产品、讲产品特性,中间穿插几个客户案例,就结束了。这一点与国内区别非常大。
好了,就这些吧,真的有点晚了。