“QingStor NeonSAN的产品定位是‘新一代软件定义分布式块存储’,是青云QingCloud自主研发的一款分布式SAN存储产品。在云时代专为企业核心业务打造,它是天然的分布式架构,可以支持云原生应用,同时还可以无缝对接传统IT的核心数据库,与稳态应用能够做到无缝兼容,广泛适用于公有云、私有云以及混合云的环境。”青云QingCloud存储产品经理冯相东说,NeonSAN 1.0的初次亮相是在2017年7月的Cloud Insight云计算峰会上,次年3月被集成到了青云QingCloud的公有云平台中。
2018年12月12日,QingStor NeonSAN 2.0如约而至。目前,NeonSAN存储已经在数十家客户实现了生产部署,分布在保险、银行、交通、零售等行业,其中有些客户已经成为行业的标杆。可以看到,青云QingCloud旗下QingStor分布式存储品牌中,NeonSAN的发展速度是非常快的(另两个QingStor产品是对象存储和文件存储)。在青云QingCloud的公有云管理平台上,性能最高的“分布式SAN”对应的就是NeonSAN存储。
从要不要上云到如何上云、怎样用好云,企业IT管理者的思路在转变,对传统IT架构也有了新的思考。传统SAN存储是过去人们经常在讨论的一种集中式块存储,其交付给客户的时候通常是以一种双控架构的形式出现,可理解为背板专有硬件集成了两个控制节点,紧密耦合在一起,这使得在业务部署的时候会以“成对”的形式出现,并且一对双控和另一对双控之间要互相通信,对网络环境有着较高要求,企业不同业务部门的存储系统难以发挥协同作用。
此外,主要由控制器支持的传统集中式块存储在算力方面存在瓶颈,如果只是堆叠性能,最后就会拖累整体系统的运行效率。同时,这样的存储系统还要配有专门的硬件设计和硬件架构,导致其本身拥有的硬件成本明显高于x86服务器,运维起来也比较复杂。通常,当这种存储出现问题的时候,就需要厂商指派专业的服务人员来解决。由此来看,传统存储在云时代必然会迎来新的变化。
在冯相东看来,云时代业务需求的存储产品应该具备五大特点:第一,基于标准x86硬件,采用软件/硬件冗余设计,确保整体架构高可用;第二,可以根据业务架构与规模进行存储架构的调整;第三,容量和性能拥有完整的Scale Out能力,让性能和容量可以随着节点线性增长;第四,具备软件定义能力和开放的API,可以为不同的业务之间提供“松”耦合;第五,要做到统一管理和运维,尽量简化运维人员参与的复杂度,降低运维成本,让存储系统自行运维。
作为一款天然支持分布式的存储架构,QingStor NeonSAN不仅支持云原生应用,还可以无缝对接传统IT的核心数据库,与稳态应用也可以做到无缝兼容,广泛适用于公有云、私有云以及混合云的环境。就像名称中的“Ne”元素那样,NeonSAN将安全、可靠、稳定视为立身之本。除了软硬件架构和数据的高可用,以及全闪与RDMA、最简I/O等方面的出色性能表现,NeonSAN在2.0版本中还加入了智能运维和更多的企业级特性。
为此,青云QingCloud在1.0版本的基础上对图形界面进行了优化,增强了监控和告警功能。其中,通过监控界面可以看到节点里面任何一个网口、任何一个SSD状态,新增的短信告警和电话告警则可以更迅速地通知客户处理相应问题。而借助智能存储介质寿命监控,除了能实现对单块SSD的寿命预测,还可以做到提前对区域进行动态扩容。
此外,QingStor NeonSAN 2.0也加入了iSCSI协议支持、数据远程复制、数据克隆与备份、QoS与自动负载均衡、ACL访问控制与权限管理、加密等六种企业级特性,以便客户可以更加灵活地部署业务。其中,有三点值得重点关注:
运行工作负载时,在单个SAN上跑多个业务是常有的事情,QoS可以针对特定的业务限定资源区间,划分合理存储空间确保存储承载的所有业务,能够均衡或者按需分配计算与存储资源。同时,由于支持iSCSI、QBD、QEMU接口,NeonSAN可以对接QingCloud、VMware、OpenStack、Hyper-V等多个平台,例如其在存储层开发了VAAI高级储存特性,提升了主机端的数据复制工作效率。容灾方面,远程复制技术允许在主站点和备站点之间部署两台存储系统,且可以实现数据的异步远程复制(秒级RPO、分钟级RTO)。
客户类型方面,QingStor NeonSAN服务的大中型客户较多,毕竟这些群体对Oracle RAC的需求更高,而NeonSAN对于如Oracle、DB2、MySQL等关系型数据库是无缝兼容的。除此之外,还可以作为大数据分析和计算的后端存储资源池使用。
考虑到NeonSAN所服务的客户类型,这些企业对关键核心业务系统的要求无疑是苛刻的,所反映出的典型应用就是数据库,既包括相对传统的Oracle、SQL Server、SAP,也有基于MySQL开源的分布式数据库。要知道,像保险企业的保单、保费支付、赔偿费用等信息都存储在数据库里,一旦出现任何问题损失难以估量。如果为这类客户做业务转型,试图改变前端的传统系统架构较为困难,在后端由分布式存储来逐步替代集中式存储相对容易一些。至于体量较小的新业务,则可以选择分布式数据库+分布式业务的方式进行切割和重构,而且完全可以直接采用Serverless、服务网格、K8S等方式来部署。
那么在实际的业务运营过程中,从原有的Oracle等一体机迁移到QingStor NeonSAN的表现又如何呢?通过青云QingCloud与保险类客户的论证,可以从三个维度来看:业务层面,多应用并发处理时传统数据库的运行效率,与安装在NeonSAN上数据库的运行效率相比,可从2小时缩短至50分钟,效率至少提升1倍,单应用场景的数据运行时间从2小时缩短到1小时,在线大数据用在精准营销场景的响应效率可提升30%左右。
运维层面,用PSQL客户端执行语句在已有的Oracle数据库中可能会出现延迟问题,而同样的工作负载下NeonSAN反馈查询数据结果可以节省30%左右的时间。青云QingCloud资深解决方案架构师傅帅谈到:“乍一看30多秒或十几分钟的速度变化不大,但其实它是有一个量级的,比如在“双11”或者“6.18”这种海量并发的场景下,每分钟保单的出单或退保的请求数量基本在1万笔以上。一笔提升30%,如果数量级是1000甚至10000,那么提升的效果就非常明显了。”
网络层面,基于万兆的以太网络来做统一的管理和维护渐成趋势,NeonSAN基于x86的NVMe的Flash卡和RDMA的以太网络是标准技术和产品,不存在专用的问题。与此同时,青云QingCloud还将网络的复杂性降低了一个维度,从以太网络+IB网络+FC网络统一变更为以太网络,以太网络可以搞定所有的网络连接。
相较于传统的金融类客户,电商客户在业务架构的选型上更为开放,某家大型零售企业在后端部署了QingStor NeonSAN,前端选择了QingStor NeonSAN+青云的云计算平台,其灵活性在于客户既可以对接物理机也可以对接云平台,这里的云平台既可以是私有云,也可以是公有云。从业务需求端来看,无论是偏重的传统工作负载还是偏互联网、分布式的工作负载,都能在云端跑起来。
长期来看,分布式存储是多数企业在云时代选择的方向之一,但要想在短时间内替换Oracle数据库显然不现实。因此,青云QingCloud除了对NeonSAN采用多种架构来保证可持续性,并且支持客户自由切换一体机,还配备了本地化的运维团队为客户提供“原厂”服务。就像运行在小型机上的Oracle配置和x86服务器上的Oracle配置不同,传统存储用SAS或SATA盘和NeonSAN的全闪在存储数据库中的参数配置也是不同的,青云QingCloud所提供的帮助是在NeonSAN上调整或部署数据库时找到一个最优化的过程。
“为什么青云可以给出最优解?因为青云所有产品都是基于x86的,我们的工程师们非常熟悉X86,熟悉Linux。这些客户之前小机都是POWER,很少用Linux来跑Oracle,而且对Linux了解的程度也没有青云这么高。”傅帅说,“另外,NeonSAN在物理机使用的时候,我们会专门开发一个基于物理机的driver,这个驱动是专门与客户的操作系统版本、内核能够匹配的,所以它能够做到最短的路径,以及最优化的I/O性能。”
傅帅表示:“客户的数据库运行起来后,就可以看到我们有些指标是可以超出他之前的性能,这种操作不亚于客户在传统架构上的运行性能,在某些指标上会超出一体机的运行能力。客户也想面向开源,他一定会用Linux,无论是数据库还是中间件,他一定用更开源的组件来支撑他的业务。”
当然,并不是所有客户的业务都适合从Oracle一体机迁移到x86,因此青云QingCloud会根据企业业务系统架构的特性来为客户制定部署方案。客户在采购的时候,既可以购买单独的NeonSAN软件,也可以采用超融合的方式来集成。硬件方面,搭载NeonSAN的一体机配备Skylake处理器,支持HDD+SSD或全闪的配置。
“QingStor NeonSAN既可以独立使用,类似于传统存储,也可以跟云整合在一块,整合进‘全栈云’解决方案,NeonSAN只是资源池的一部分。”傅帅谈到,“青云在基础架构层面,尤其是对中国的企业客户IT系统架构的要求,理解得还是比较深刻的,而且是产品化的产品,不是项目型的交付方式。”2019年第一季度,NeonSAN将开放广东可用区。
长期来看,分布式存储逐步取代传统的集中式存储已是大势所趋,NeonSAN的发展方向也将朝着双活、全用户态驱动、AI运维等方向继续迈进。对于青云QingCloud而言,包括QingStor在内的存储、计算、网络构成了基础架构层,向上则是以容器、微服务等形态为代表的云平台,再向上是OpenPitrix、AppCenter等应用级的交付工具,而顶层还有VDI这样的云桌面。这些,就是青云QingCloud的全栈云为客户提供的全域解决方案。
“我们由‘云’来做积累,对很多行业客户的应用场景、业务场景、IT运维需求很熟悉,之后与产品进行匹配,最终交给客户一个针对数据中心的完整方案,云可能只是一部分。对于整个IT架构来说,客户完全可以基于青云QingCloud的全套产品来做数字化转型,而不仅仅是云平台。”傅帅说。