Gartner预测,相对于2020年,大型企业在本地、边缘和公有云上拥有的非结构化数据将增长三倍。到2024年末,有70%的混合云存储方案将用于企业内部的数据容灾、备份、恢复以及保持业务连续性的场景中。混合云存储是企业在未来将大量采用的存储架构,使用一种以上混合云存储方案的企业,将从2020年的10%,提高到2024年的40%。与此同时,越来越多的应用正在往云上迁移,无论是开发者还是中小企业,使用云上的资源能带来更大的弹性和敏捷性。

 

公有云上的存储产品五花八门,在每个类目里还有不同的规格,大多数公有云的块存储云盘里包含了标准云盘、SSD、甚至极速SSD类型,对象存储也有标准型、归档型等规格,在一些公有云的文件存储类目中,包含标准NFS/SMB文件存储、并行文件系统的容量型、性能型等产品。在公有云的IaaS存储产品如此丰富的背景下,第三方的存储厂商如何与公有云结合,给用户提供差异化的服务呢?

 

公有云上的存储产品以及接口形态上,以AWS Marketplace上的storage细分为例,我们可以看到,200多个第三方storage产品,大致分为以下几个类别:

  • 数据备份/恢复类,占60%左右

  • 文件存储,占30%左右

  • 其它的数据管理类产品,占不到10%

根据这些第三方产品的分布情况,我们可以稍加分析:

1

公有云以块存储为基石,没有块存储,虚拟机、基本的数据盘都无法创建,云计算无从谈起,所以市场上公有云的块存储在各家的存储产品版图上都是不可或缺的基座级产品,只是随着上层应用对性能的细分,不同公有云厂商会提供出不同规格的块存储云盘,满足性能上的差异。此外,如果第三方厂商基于公有云的块存储再提供块存储,也显得冗余而没有必要,所以几乎没有第三方在公有云上提供块存储产品和方案。

2

对象存储的接口形式上差异不大,只是API具体定义上有些差别,各家都提供了基于http的接口以及各种语言版本的SDK,根据数据的冷热情况,给客户提供访问速度不同的对象存储形态。对象存储在公有云上也相对成熟,所以第三方厂商在公有云的对象存储上也鲜有可发挥的空间。

 
 

3

 

公有云上的存储产品基本是提供基本的数据访问服务,关于数据备份,大多是由用户完成。跨云或混合云的数据备份、恢复,是混合云的重要场景以及第三方的重要关注点。因此可以看到,在AWS的Marketplace上,有大量的存储产品提供数据备份相关服务。

4

 

有意思的是,公有云上有不少第三方的文件存储产品,这有以下几方面原因:

首先,文件存储的服务的应用场景较多,而且不同于块存储或对象存储,不同应用对文件的IO模型千差万别,公有云厂商大多只能针对通用型的应用场景进行优化,对于细分场景的性能、功能、使用习惯上的优化,用户就需要通过第三方文件存储产品来满足。例如AWS上的SoftNAS、WekaIO等,就通过功能或性能层面,来弥补公有云现有文件存储产品的不足,YRCloudFile也是在性能和高并发上去满足用户业务场景上的特殊要求。

其次,对于用户而言,公有云的文件存储在成本上仍然偏高,用户希望针对文件数据的冷热实现更好的声明周期管理,从而降低公用云上的文件存储整体成本,这也是第三方文件存储厂商可以发挥的空间。

当然,由于公有云上提供的都是标准化计算、存储资源,第三方厂商基本只能通过软件的形式,在公有云上交付他们的文件存储产品,例如NetApp、Qumulo等在线下主要通过软硬件交付的文件存储产品,在AWS上都需要转化成纯软件方式进行交付。

第三方存储厂商无论是在公有云还是混合云上提供产品或服务,以软件的方式进行交付基本上是必要的前提,基于此,也更容易理解“软件吞噬世界(Software is eating the world)”的含义。

5

 

从混合云存储的应用场景看,不论在AWS Marketplace还是Gartner的报告中我们都能看到,备份/恢复、满足容量和计算需求的突发增长都是混合云存储中使用最多的场景,基于这些场景,结构化、非结构化数据的备份,以及私有云/公有云/多云之间的数据流动和打通,都有不同的解决方案。

YRCloudFile作为软件定义的分布式文件存储产品,瞄准了公有云在文件存储的高并发支持、高性能上的一些不足,已经在公有云上提供了文件存储的能力,并服务了IoT、自动驾驶、渲染等业务场景的客户。