概述

本文主要介绍如何搜索云数据库Redis中过大的Key。

 

详细信息

Redis提供了List、Hash、Zset等复杂类型的数据结构,在使用Redis时可能由于Key设计不合理导致某个Key过大。而Redis为简单的单线程模型,获取或者删除较大Key时都可能会对业务产生一定影响,另外在集群模式下大Key的产生还很容易导致某个子节点的内存溢出。综上所述我们需要搜索工具来发现过大的Key。

 

对于Redis主从版本可以通过SCAN命令进行扫描,对于集群版本阿里云提供了ISCAN命令进行扫描,命令规则如下。

iscan [$DB_Idx] cursor [MATCH pattern] [COUNT count]

注:[$DB_Idx]为节点的ID,从0开始,可以通过info命令来获取。16到64GB的集群实例为8个节点,故[$DB_Idx]为0到7,128GB和256GB的为16个节点,以此类推。

 

为了便于搜索过大的Key,本文提供Python版的扫描脚本,使用方法如下。也可使用redis-cli的“--bigkeys”选项查找大Key

  1. 执行如下命令,下载Python版本的Redis客户端。
    wget "https://pypi.python.org/packages/68/44/5efe9e98ad83ef5b742ce62a15bea609ed5a0d1caf35b79257ddb324031a/redis-2.10.5.tar.gz#md5=3b26c2b9703b4b56b30a1ad508e31083"
  2. 依次执行如下命令,安装Python版本的Redis客户端。
    tar -xvf redis-2.10.5.tar.gz
    cd redis-2.10.5
    sudo python setup.py install
  3. 参考如下代码,创建名为“find_bigkey”的扫描脚本。
    import sys
    import redis
    def check_big_key(r, k):
      bigKey = False
      length = 0 
      try:
        type = r.type(k)
        if type == "string":
          length = r.strlen(k)
        elif type == "hash":
          length = r.hlen(k)
        elif type == "list":
          length = r.llen(k)
        elif type == "set":
          length = r.scard(k)
        elif type == "zset":
          length = r.zcard(k)
      except:
        return
      if length > 10240:
        bigKey = True
      if bigKey :
        print db,k,type,length
    def find_big_key_normal(db_host, db_port, db_password, db_num):
      r = redis.StrictRedis(host=db_host, port=db_port, password=db_password, db=db_num)
      for k in r.scan_iter(count=1000):
        check_big_key(r, k)
    def find_big_key_sharding(db_host, db_port, db_password, db_num, nodecount):
      r = redis.StrictRedis(host=db_host, port=db_port, password=db_password, db=db_num)
      cursor = 0
      for node in range(0, nodecount) :
        while True:
          iscan = r.execute_command("iscan",str(node), str(cursor), "count", "1000")
          for k in iscan[1]:
            check_big_key(r, k)
          cursor = iscan[0]
          print cursor, db, node, len(iscan[1])
          if cursor == "0":
            break;
    if __name__ == '__main__':
      if len(sys.argv) != 4:
         print 'Usage: python ', sys.argv[0], ' host port password '
         exit(1)
      db_host = sys.argv[1]
      db_port = sys.argv[2]
      db_password = sys.argv[3]
      r = redis.StrictRedis(host=db_host, port=int(db_port), password=db_password)
      nodecount = r.info()['nodecount']
      keyspace_info = r.info("keyspace")
      for db in keyspace_info:
        print 'check ', db, ' ', keyspace_info[db]
        if nodecount > 1:
          find_big_key_sharding(db_host, db_port, db_password, db.replace("db",""), nodecount)
        else:
          find_big_key_normal(db_host, db_port, db_password, db.replace("db", "")) 
  4. 参考如下命令,查找较大的Key。
    python find_bigkey [$DB_Host] [$DB_Port] [$DB_Pass]
    注:
    • [$DB_Host]:Redis数据库的主机名或IP地址。
    • [$DB_Port]:Redis数据库的端口号,默认为“6379”。
    • [$DB_Pass]:Redis数据库的密码。
    • 该命令支持查找Redis主从版本和Redis集群版本中的大Key。此处的大Key阈值为“10240”,比如:String类型的Value大于10240的是大Key,List长度大于10240认为是大Key,Hash Field的数目大于10240认为是大Key。
    • 该脚本默认每次搜索1000个Key,对业务的影响比较低,不过最好在业务低峰期进行操作,避免scan命令对业务造成影响。
    系统显示类似如下。