对于开展互联网业务的现代企业来说,数据库是企业的核心资产,其系统的数据量和访问量都很高,并且存在流量爆发的场景。数据库的稳定性往往关系到企业的互联网业务是否能正常开展,甚至关系到企业的生死
众所周知,阿里云数据库RDS MySQL 具有高效、稳定、安全可靠、可弹性伸缩的特点,但这听起来似乎有点模糊。其实云数据库RDS MySQL在包括内核、管理系统上都进行了深度的优化。本系列文章将会逐一对RDS MySQL的特性进行拆解,从效能、稳定性、安全三个角度分享相比开源MySQL的核心优势。
本文重点介绍阿里云数据库MySQL的内核查询加速技术Fast Query Cache功能。
1. OLTP数据库的请求特点和优化方案
大部分的业务数据库系统都是在线事务性(OLTP)的,究其特点,一是单次操作数据库的关系数据量很少,如几条记录或者几十条记录;二是对数据库的读请求量要远高于写请求量,即读写比严重不平衡,如电商业务订单系统,一条订单随业务推展而状态改变约在10次,而对应的查询次数要超过200次。所以OLTP类数据库的资源主要消耗于对小数据量的查询请求处理。
为了解决这种读写比倾斜严重的问题,一般会采取如下几种方案:
方案一:扩容数据库硬件,尤其是增加内存,我们称之为 数据库的Scale up的方案。对应MySQL增加Buffer Pool大小,可快速有效提升性能。
方案二:可称之为数据库的Scale out方案,增加数据库读副本,MySQL相对比较容易做到,通过建立多个只读备库可极大的扩充数据库的读请求处理能力。但本方案带来一个问题,就是应用要实现对读写请求的路由识别,只将读请求(非事务内)路由到只读库,否则大量写请求路由到只读库后业务将会出现大量失败,“不小心”还会导致数据写入错误。另外,应用还需要关注只读库与源库的数据延迟时间,时间太长一般业务都难以接受,经验来看秒级延迟是基本要求。
方案三:对业务系统进行架构改造,做大量的解耦工作,针对核心表做成中心服务化形式对外提供服务,如阿里淘宝天猫的几大C系统模式。该方案的核心就是引入缓存系统,一般开源如Redis系统,利用缓存承接大量的读请求,但整体系统需要考虑缓存失效的问题,同时还要分别维护缓存和数据库两套系统,技术研发成本较高。
2.开源MySQL的Query Cache方案和问题
从上述三种方案比较来看,方案三增加查询结果集缓存是对数据库非常理想的解决方案,这也是大型互联网公司普遍采用的方案,但此方案毕竟要涉及不少的应用系统改造,工程量较大,故MySQL引入了一种查询缓存技术(Query Cache)。
MySQL Query Cache的执行流程图如下,其保存查询返回的完整结果,当新查询命中该缓存会立刻返回结果,跳过了SQL解析、优化和执行等复杂阶段。同时Query Cache会跟踪查询中涉及的每个表,如果这些表发生变化,那么和这个表相关的所有缓存都将失效。
MySQL Query Cache原理上是通过使用额外内存来节约CPU资源来达到查询加速的目标,是一项非常实用的技术,与MySQL组合Redis方案相比,具有以下几个优势:
但开源MySQL 实现的Query Cache不够优雅,实际应用中存在不少问题:
3.阿里云数据库MySQL的Fast Query Cache
阿里云数据库MySQL针对开源MySQL问题,通过对Query Cache重新设计,实现了一种更好的查询缓存机制,称为Fast Query Cache,解决了以上几个主要问题:
阿里云数据库MySQL Fast Query Cache 开启方法和开源Query Cache完全一致,通过query_cache_type参数设置为“ON”打开。在实际测试中,采用4核8GB内存的机器,利用sysbench压测,总共数据量有250MB(25张表,每张表40000条记录),效果非常好。
1)全部命中只读场景
Sysbencholtp_point_select,用例中仅包括主键上的点查(point select),将Query Cache设为512MB,内存大于测试数据量,缓存命中率达到99%以上。
测试结果显示,在较高并发的场景下,MySQL原生Query Cache并发处理性能出现较大幅度的降低,Fast Query Cache在各个并发场景下无性能降低,最高时能够提高一倍的QPS。
2)高命中率只读场景
Sysbencholtp_read_only,用例中包含返回多条记录的范围查询,将Query Cache设为512MB,内存才相对比较充足,命中率可以达到80%以上。
测试结果显示,随着并发数的增加,MySQL原生Query Cache的性能出现明显的降低,Fast Query Cache的性能则会不断提升,最高时能够提高一倍多的QPS。
3)低命中率只读场景
Sysbencholtp_read_only,用例中包含返回多条记录的范围查询,将Query Cache设为16MB,内存明显严重不足,缓存命中率只有10%左右,内存不足时会涉及缓存项的大量淘汰,影响性能。
测试结果显示,MySQL原生Query Cache的性能降低明显,最多出现了接近50%的性能损失,Fast Query Cache优化了低命中率场景,将性能损失控制在2%以内。
4)读写混合场景
Sysbencholtp_read_write,每个事务中都有对表的更新操作,可以认为缓存基本处于失效状态,频繁的更新操作涉及缓存的主动淘汰,理论上会比较影响性能。
测试结果显示,Fast Query Cache在读写混合场景下不会出现过多的性能降低,整体性能影响控制在2%以内。
4.总结
阿里云数据库MySQL Fast Query Cache大大增强了数据库查询性能,通过增加一点点的内存换取巨大的性能提升,在主要业务场景(读场景)中性能提升达到1倍,将会取得巨大的收益,在使用方式上和开源MySQL Query Cache保持完全一致,具备领先业界的产品竞争力。
目前Fast Query Cache已经在RDS 和云数据库专属集群中具备。云数据库专属集群RDS,用户100%独占底层物理机,且支持用户通过弹性资源功能灵活调配数据库实例资源占用,这样开启Fast Query Cache将会再获得一倍性能收益,结合CPU超配技术最少获得的一倍收益,则相比于在物理机自建,专属集群整体成本可达到后者约30%,是目前云上企业最好的数据库节省成本方案。
云数据库专属集群MyBase
云数据库RDS Mysql