《DevOps三十六计》简介:
新型的DevOps 涵盖了从需求提出到软件发布的整个软件生命周期,是产品设计、项目管理、开发、测试和运维提升的必由之路,国内大型互联网企业已经做了很多探索,并将相关技能规范化、文档化、工具化、自动化甚至智能化。遗憾的是,这些宝贵经验往往仅在团队或公司内部分享,很多中小公司还在重复走着大公司走过的弯路。
为了促进先进经验在整个行业内分享和传播,DevOps 时代社区和高效运维社区邀请了40 位业界大咖,从精益、敏捷、开发、测试、运维、架构、安全等各个方面分享他们在顶级互联网公司及领先的传统企业的多年智慧和经验结晶。《DevOps三十六计》共有36篇文章,1349 条计策,其中很多计策都是在经历了刻骨铭心的事故后总结出来的,配套的115 个案例则是精选的、对相关计策的解读。
《DevOps三十六计》旨在总结经验、交流共享,让国内互联网及传统企业缩短成长路径、避免无谓的反复踩坑,让技术人员更好地聚焦于业务目标和业务产出。
《DevOps三十六计》主编为萧田国和梁定安,欢迎提出宝贵意见和建议。
《DevOps三十六计》目录:
第一章 精益
精益产品开发三十六计 何勉/ 2
总说/ 2
三十六计/ 4
案例:影响地图应用实例/ 8
更多案例
◎ 看板可视化方案设计实例
精益看板三十六计 李智桦/ 13
总说/ 13
三十六计/ 14
案例:看板的系统思维/ 16
更多案例
◎ 运用看板引导会议的进行
第二章 敏捷
大规模敏捷三十六计 赵卫/ 24
总说/ 24
三十六计/ 27
案例:大规模敏捷变革管理/ 31
更多案例
◎ 大规模敏捷组织结构
◎ 敏捷需求
◎ 敏捷架构
◎ 大规模敏捷运作
敏捷Scrum 三十六计 方炜/ 申健/ 38
总说/ 38
三十六计/ 40
案例:采用Scrum of Scrum 方式提升多团队间的协作/ 47
更多案例
◎ 关注专注力培养仪式感,提升Scrum 活动的效果
◎ 采用“观察—导向—决定—行动”方式持续解决问题,
打造优秀的Scrum 团队
敏捷项目管理三十六计 杨晓俊/ 52
总说/ 52
三十六计/ 54
案例:现场客户/ 57
更多案例
◎ 需求评估点
◎ 站立晨会
Jira 三十六计 何英华/ 61
总说/ 61
三十六计/ 64
案例:Jira 对敏捷和精益的落地支撑/ 69
更多案例
◎ 测试管理利器:Zephyr 插件
第三章 持续交付
持续交付三十六计 张乐/ 石雪峰/ 77
总说/ 77
三十六计/ 79
案例:大型复杂产品的持续交付/ 83
更多案例
◎ Facebook 的分支策略演进助力持续交付
◎ Preflight 持续集成为质量保驾护航
◎ 大型团队推广持续集成
Git 应用三十六计 石雪峰/ 91
总说/ 91
三十六计/ 95
案例:多重体系保证版本控制系统的安全和高可用/ 99
更多案例
◎ 分支间快速差异对比和代码合并
◎ 保留历史记录,进行版本控制库拆分
Jenkins 三十六计 景韵/ 雷涛/ 李华强/ 104
总说/ 104
三十六计/ 106
案例:企业级Jenkins 之构建环境标准化、
集群化、弹性化/ 109
更多案例
◎ 企业级Jenkins 之插件推荐列表
◎ 企业级Jenkins 之数据备份方案
◎ 企业级Jenkins 之精细化权限管理
◎ 企业级Jenkins 之精准化通知
◎ 乐视EUI 持续集成案例
Docker 应用三十六计 谭用/ 114
总说/ 114
三十六计/ 116
案例:优雅地停止容器/ 119
更多案例
◎ 给镜像瘦身
◎ 管好2375 端口
SaltStack 运维三十六计 赵舜东/ 123
总说/ 123
三十六计/ 126
案例:SaltStack 灵活的目标选择方式/ 130
更多案例
◎ YAML 编写技巧三板斧
◎ 使用salt-cloud 进行混合云管理
第四章 开发架构与运维开发
微服务架构三十六计 王磊/ 陈俊良/ 139
总说/ 139
三十六计/ 141
案例:微服务不只是拆拆拆/ 145
更多案例
◎ 微服务的轻量级测试
◎ 微服务创业的快与慢
Python 开发技巧三十六计 郭宏泽/ 152
总说/ 152
三十六计/ 154
案例:开发一个简单的监控平台/ 156
更多案例
◎ 如何选择Python 版本
◎ 自己动手实现运维平台
第五章 监控与质量测试技术
容量管理三十六计 梁定安/ 163
总说/ 163
三十六计/ 165
案例:容量木桶原理的应用/ 167
更多案例
◎ 架构前进一小步,容量提升一大步
◎ 结合“容量考核”合理使用运营成本
自动化测试三十六计 汪珺/ 171
总说/ 171
三十六计/ 176
案例:批量执行自动化测试的策略改进/ 179
更多案例
◎ 自动化测试思维的变化
◎ 无法适应变更的“死”自动化测试脚本
测试方法三十六计 徐奇琛/ 潘晓明/ 万千一/ 183
总说/ 183
三十六计/ 185
案例:统一化持续集成、持续交付,收归风险提升效率 / 190
更多案例
◎ 未覆盖最终版本带来的巨大风险
◎ 用JMeter 构建可靠廉价的压力测试方案
◎ 利用MAT 分析定位Android 内存泄漏问题
◎ UI 式样检测工具让测试人员拥有火眼金睛
◎ 运营活动监控系统为线上运营活动提供有力保障
第六章 安全技术
业务安全运维三十六计 邓冬瑞/ 196
总说/ 196
三十六计/ 199
案例:技术不是万能的,但是离开技术是万万不能的/ 201
更多案例
◎ 提高运营效率,快速响应,各司其职
◎ 要及时检视策略并做出相应调整,否则会殃及正常用户
安全测试三十六计 宗良/ 项阳/ 205
总说/ 205
三十六计/ 208
案例:有目的有计划的事前信息采集可以让安全
测试事半功倍/ 211
更多案例
◎ 没有考虑安全的设计就是没有防盗门的金库
◎ 仅仅发现问题,那是管杀不管埋
安全运维三十六计 韩方/ 216
总说/ 216
三十六计/ 217
案例:定期备份日志,还原入侵事件真相/ 221
更多案例
◎ 用多种认证手段提升安全防护等级
◎ 危险的匿名登录默认配置
第七章 大数据技术
数据质量三十六计 陈靖翔/ 226
总说/ 226
三十六计/ 229
案例:规范的企业主数据管理是数据质量的基石/ 233
更多案例
◎ 糟糕的数据处理架构会让数据异常处理付出更大的代价
◎ 精准的质量监控阈值会让运维工作更高效
大数据运维三十六计 范伦挺/ 236
总说/ 236
三十六计/ 238
案例:数据驱动精细化运维/ 241
更多案例
◎ 欲速则不达——直接删除惹的祸
◎ 数据驱动智能运维
◎ 离线作业监控平台的应用
第八章 日常运维
日常运维三十六计 梁定安/ 246
总说/ 246
三十六计/ 248
案例:从源头优化运维工作/ 250
更多案例
◎ 演习,为容灾策略保鲜
◎ 重点关注与保障不可逆操作的质量
Linux shell 三十六计 阿铭/ 254
总说/ 254
三十六计/ 255
案例:根据网卡名字输出对应的IP 地址/ 259
更多案例
◎ 自动封/ 解封IP
◎ 监控httpd 进程
◎ 备份数据库
◎ 监控磁盘使用
◎ 构建一个发布系统
网络运维三十六计 张永福/ 265
总说/ 265
三十六计/ 267
案例:利用自动化运维工具提升工作效率/ 270
更多案例
◎ 在网络排障中锻炼“抽丝剥茧”的能力
◎ 网络运维过程中团队合作的重要性
分布式存储运维三十六计 高向冉/ 275
总说/ 275
三十六计/ 277
案例:不及时回收删除的文件引发的成本问题/ 280
更多案例
◎ 微信存储应对节假日大规模突发事件
◎ 定期进行单点剔除演习的重要性
◎ 现网一定要干干净净
第九章 自动化运维
自动化运维三十六计 胥峰/ 285
总说/ 285
三十六计/ 286
案例:建设自动化运维体系/ 289
CMDB 三十六计 王津银/ 303
总说/ 303
三十六计/ 306
案例:应用CMDB 支撑更多的核心场景/ 309
更多案例
◎ 每个成功的CMDB 都离不开全员参与
◎ 面向新IT 的CMDB 模型管理新思路
第十章 运维管理
运维管理三十六计 涂彦/ 315
总说/ 315
三十六计/ 317
案例:运筹帷幄,解密远程管理/ 321
更多案例
◎ 运维管理者如何与年轻员工打成一片
◎ 用互联网产品思维管理远程团队
轻量ITSM 三十六计 闫林/ 328
总说/ 328
三十六计/ 332
案例:某大型银行大面积业务中断故障/ 338
更多案例
◎ 从5 万个网站宕机谈起
◎ 从2008 年北京奥运售票系统的崩溃谈起
第十一章 数据库运维
互联网数据库运维三十六计 周小军/ 341
总说/ 341
三十六计/ 342
案例:优化热记录与肥胖记录/ 344
更多案例
◎ 未经测试的数据搬迁工具引发的故障
◎ 节假日前的数据库容量规划
MongoDB 运维三十六计 周李洋/ 349
总说/ 349
三十六计/ 351
案例:MongoDB 执行计划分析——知其所以然/ 355
更多案例
◎ 由于滥用Schema less 导致的运营事故——
Schema less 而非Schema free
◎ 提前排兵布阵,减少阵型调整带来的损耗——
Sharding 架构下预分片
Oracle 运维三十六计 盖国强/ 361
总说/ 361
三十六计/ 363
案例:禁止远程DDL 和业务时间的DDL 操作/ 368
更多案例
◎ 有效的备份重于一切
◎ 测试和生产环境隔离
PostgreSQL 运维三十六计 周正中/ 375
总说/ 375
三十六计/ 377
案例:菜鸟末端轨迹项目中的面面判断/ 381
更多案例
◎ 共享充电宝实时经营分析系统的后台数据库设计
第十二章 数据中心运维
CDN 运维三十六计 高向冉/ 396
总说/ 396
三十六计/ 398
案例:应对CDN 各层级网络问题/ 400
更多案例
◎ NBA 直播总决赛突发场景应对
◎ 机房网络异常下的快速处理机制
数据中心运维节能三十六计 闫林/ 405
总说/ 405
三十六计/ 407
案例:某IT 企业高能耗大型数据中心的分析与改善/ 411
更多案例
◎ 某石化企业高能耗大型数据中心的分析与改善
◎ 某互联网公司大型数据中心的节能环保措施
IDC 运维三十六计 王莹/ 414
总说/ 414
三十六计/ 415
案例:inode 引发的业务中断/ 418
更多案例
◎ SAN 存储故障
◎ SAN 架构调整
致谢/ 423
· · · · · ·