随着数字经济的飞速发展,各行各业都需要储存、提取、使用大量信息,伴随着新业务模式的到来, 数字系统的后台应用及平台也在面临着从传统架构向新型分布式架构变迁的过程。业务越集中, 对IT技术平台的分布式架构要求越高。后端软件从集中式架构向分布式架构的转型越来越迫切。
从另一个角度来看, 越来越多非结构化数据、影音图像数据、地理位置信息逐渐被采集与归档。在人工智能与深度学习进一步发展之后, 针对这些非结构化数据进行的加工与分析, 会成为下一代信息革命的关键之一。
以金融行业为例,大部分银行都已建设了完整的影像平台, 用来集中管理非结构化数据。随着数据量的级变和大数据的发展, 企业再次提出对更多渠道来源数据的采集与归档的需求。例如, 监管机构提出对多渠道办理业务需要有录音录像可查的要求, 使金融机构的非结构化数据从数量上还是种类上都有了极大的增加。但是, 传统的非结构化数据管理系统, 不仅从数据量上, 还是从物理存储的成本上, 都已经不能满足当前的非结构化数据存储的需要。
从发展趋势上看,分布式存储方案已经为未来企业针对非结构化数据价值的挖掘, 进行原始数据的汇聚积累和分类。可控成本的分布式数据存储和基于分布式存储的非结构化数据管理系统, 便应运而生, 成为针对这类使用场景的最佳解决方案。
分布式存储最早是由谷歌提出的,其目的是通过廉价的服务器来提供使用与大规模,高并发场景下的 Web 访问问题。它采用可扩展的系统结构,利用多台存储服务器分担存储负荷,利用位置服务器定位存储信息,它不但提高了系统的可靠性、可用性和存取效率,还易于扩展。
分布式存储的兴起与互联网的发展密不可分,互联网公司由于其数据量大而资本积累少,而通常都使用大规模分布式存储系统。与传统的高端服务器、高端存储器和高端处理器不同的是,互联网公司的分布式存储系统由数量众多的、低成本和高性价比的普通 PC 服务器通过网络连接而成。其主要原因有以下三点(1) 互联网的业务发展很快,而且注意成本消耗,这就使得存储系统不能依靠传统的纵向扩展的方式,即先买小型机,不够时再买中型机,甚至大型机。互联网后端的分布式系统要求支持横向扩展,即通过增加普通 PC 服务器来提高系统的整体处理能力。(2) 普通 PC 服务器性价比高,故障率也高,需要在软件层面实现自动容错,保证数据的一致性。(3) 随着服务器的不断加入,需要能够在软件层面实现自动负载均衡,使得系统的处理能力得到线性扩展。
存储资源盘活系统是分布式存储面向复杂场景与混合云的优化产品,它不独占硬件资源,可与现有应用混合部署在同一套硬件设备上,不影响现有业务的运行的同时将闲置存储资源予以整合,帮用户把现有服务器集群中存储资源利用率不高的设备进行统一管理,形成统一存储资源池。通过标准 iSCSI 协议为上层应用提供虚拟 Target 和逻辑卷,可被灵活调度、分配、使用。可以与天翼云对象存储oos无缝对接,获得无限的存储空间。它在硬件、协议、架构等层面探索了分布式存储系统未来的方向。
闪存普遍被认为是存储行业的发展方向,其具备远高于传统磁盘存储的数据吞吐能力及更低的时延。数据显示,固态硬盘对比机械硬盘,拥有更快的读取速度、更低的功耗以及更低的故障几率,实现了对机械硬盘性能的全面超越,为底层存储介质的替换提供了客观条件。未来的存储产品应该像天翼云存储资源盘活系统一样,在物理层是支持全闪和混闪的。存储资源盘活系统是用户态进程级的软件定义存储控制器,只需3个命令即可在Linux操作系统上完成安装,从安装包解压到集群初始化不超过3分钟。可安装在物理服务器、裸金属服务器以及虚拟机中。
软硬解耦、易于扩展、自动化、基于策略或者应用的驱动是存储系统发展的特征。就业务应用来说,即不限制上层应用,不绑定下层硬件;除了提供块存储,也可以在同一平台提供文件、对象、HDFS 等存储服务,实现非结构化数据的协议互通;同时应具备完善的监控能力,实现应用感知。例如天翼云存储资源盘活系统,提供标准化iSCSI接口,使客户能够直接迁移数据,避免应用的大量修改。支持部署全闪存或混合 SSD/HDD 存储节点,允许集群中每个实例具有不同的硬件配置。可以与多种虚拟化平台,数据库系统,应用系统整合。
随着数据量的爆发式增长,许多企业产生数据的量级由原有的TB 级别迅速的提升到 PB 甚至 EB 级别。企业付出成本来存储这些数据的同时自然也想通过挖掘数据信息辅助商业决策,提升管理效率。面对众多的数据与信息来源,未来的存储系统在连接层上必须更普适,更丰富。例如存储资源盘活系统的按需流动功能,基于数据冷热和应用负载分析,使得数据按需流动在本地的不同磁盘与云端,满足不同生命周期阶段性能及成本诉求。它的多云对接也是灵活化的典范:通过 API、脚本和插件等多种方式对接管理平台,确保融入客户流程,不改变客户固有习惯。
各类型数据存储技术仍在不断的完善和创新,以适应日益增长和不断变化的数据存储需求,形成了多层级、广泛覆盖的产品体系结构。随着物理层闪存化,协议层标准化,架构层弹性化,连接层灵活化的发展,未来的存储系统让企业用户无需关心存入数据的类型,系统自行选择最优形式进行存储。同时,弹性灵活的架构使得系统能够存储海量异构数据,构筑统一的数据底座,提供统一存储访问接口,解决系统间数据孤岛、各类应用统一访问问题,真正做到“存储资源盘活”。
参考资料:
王涛.企业级内容管理系统向分布式存储变迁的趋势[J].金融电子化,2017,(02):88-90.
李振.基于云计算分布式存储架构与容错技术的研究[J].网络安全技术与应用,2022(01)
李网灿,赵勇.基于天翼云对象存储的存储网关建设研究[J].江苏通信,2020,36(04):82-85.