最近花了两天时间用 muduo 部门实现了 memcached 处事器协议,代码位于
examples/memcached/server,能通过 memcached 的大部门测试用例(incr/decr 还没有实现)。
这不是 memcached 的替代品(它没有实现LRU和超时成果,也没有实现二进制协议,更没有本身打点内
存),而是一个网络编程的示例(代码只有 1000 行,比 memcached 小许多),展示 muduo 气势气魄的事
件驱动编程,以及未来机能优化的试验品(换句话说,此刻这个版本完全没有在机能上做出任何尽力)
。读过 memcached 代码的人可以比拟这两种编程气势气魄的区别,memcached 的 read/write 操纵穿插于
正常逻辑处理惩罚,而 muduo 的网络数据读写是由库完成,应用措施只体贴动静收发,今朝二者的根基
get/set 操纵的机能相当。
此刻 muduo 的 inspector 内置了 gperftools 的长途 profiling
成果,memcached-debug 展示了其用法。
为什么不必优化 set 操纵(含
set/add/update/append/prepend/cas 等)的机能?
1. 比例。既然是 memcache,那么
get:set 的比例很高,10:1 甚至更高,因此优化的重心应该是 get 而非 set。
假设
memcached 能处理惩罚 100k QPS,再假设这些操纵都是 set(其实应该不到 10% 是 set),再假设所有的
set 都是串行执行的(没有并发),那么每次 set 的 CPU 时间不该该高出 10 us(含处事器当地的网
络代码运行时间,但不含网络延迟)。而实际上一次 set 的 CPU 时间最多是 2~3 us (用
memcached-footprint 措施测得),基础不值得优化。
2. 网络带宽。假设一次 set 操纵的
key + value 的长度是 1k bytes,TCP 的有效载荷带宽按110MB/s估算,那么1kB数据在千兆网上的惯
性延迟是 9us(传输延迟是几十上百微秒,与此无关),也就是说处事器的网卡收到这 1kB 数据需要
花 9us 时间(从第一个字节到到达处事器到收完最后一个字节),那么在 set 耗时 2~3 us 的环境下
再去优化它是做无用功。
3. 发生“需要更新的数据”的本钱远大于 memcached set 的开销。
memcached 需要更新,往往是将已写入数据库的新数据放到 memcached 中,那么写数据库的开销远远
大于 memcached set 的开销,优化 set 对晋升系统整体机能没意义。
查察本栏目