传感器、爬虫、激光雷达、摄像头等前端设备和软件,以及大量用户,每天都在往企业内部输入大量非结构化数据,为了保存和维护好数据这个新型的生产要素,企业每年支付用于非结构化数据存储上的成本也在快速增长。
对于大多数企业用户而言,数据具有阶段性热点访问的特点,超过一定时间后,80% 以上的数据逐步转冷。热数据的访问性能要求较高,经过一定时间周期之后,热数据逐渐变冷,应用访问这些冷数据的频率会变得很低。

如何解决海量非结构化数据存储及访问性能,同时兼顾企业用户对非结构化数据的整体使用成本,是 CIO 们面临的主要问题。
近期,焱融科技发布了 YRCloudFile 新版本,该版本对智能分层功能做了全面的升级,将分层策略细粒度到目录级别。例如目录 A 的冷数据下刷到阿里云 OSS,目录 B 的冷数据下刷到AWS 的 S3,目录 C 的冷数据下刷到本地对象存储。
细粒度的分层策略有什么好处呢?
冷数据定义更灵活
众所周知,公有云的对象存储的使用成本,有三部分组成,存储容量费用、API 调用费用、网络流入流出费用。很多时候,API 调用或者网络流入流出费用,往往比存储容量的费用要大的多。
So easy,不同应用,不同策略,不同对象存储厂商
对于数据中心而言,不同的应用,对冷数据的定义是不同的,对数据存放的要求也不同。例如,数据安全要求高的冷数据要求存放在本地;数据安全要求低的数据可以存放在公有云。又如,训练数据在被频繁的训练 2 周之后就不再访问,趋冷;训练结果数据则会在很长的时间段内一直需要频繁访问。
任性,想存哪里就存哪里