《网站运维技术与实践》

《网站运维技术与实践》

基本信息

作者: 饶琛琳   

出版社:电子工业出版社

ISBN:9787121224331

上架时间:2014-3-14

出版日期:2014 年3月

开本:16开

页码:446

版次:1-1

所属分类:计算机 > 计算机网络 > Web Server > 综合

《网站运维技术与实践》 

更多关于》》》《网站运维技术与实践》

 

编辑推荐 

      资深一线运维专家诚意之作,总结多年实践经验,深入浅出,内容涵盖运维工作各方各面。

  百度、新浪、人人、音悦台等多名技术经理、高级工程师联名力荐。

  《网站运维技术与实践》深入阐述了运维工作所涉及的监测调优、日志分析、集群规划、自动化部署、存数和数据库等各方面的技术要点,引入了对最新开源产品的实践经验,包含了对自动化运维和DevOps等技术形态的大量思考,旨在帮助运维人员“懒惰、急躁和傲慢”(程序员的三大美德)地完成网站运维工作。

 

内容简介

    书籍

    计算机书籍

  网站运维工作,一向以内容繁杂、覆盖面广著称。《网站运维技术与实践》选取日常工作涉及的监测调优、日志分析、集群规划、自动化部署、存储和数据库等方面,力图深入阐述各项工作的技术要点及协议原理,并介绍相关开源产品的实践经验。在技术之外,作者也分享了一些关于高效工作及个人成长方面的心得。

  《网站运维技术与实践》适合linux 系统管理员、中大型网站运维工程师及技术负责人、devops 爱好者阅读。同时也适于刚踏上或有兴趣踏上运维岗位的年轻朋友,了解运维职业的工作和发展。

 

媒体评论

  最早跟年年(饶琛琳)的认识和沟通一直都是在微博和他的博客上,他是我很尊重的技术思考者和实践者。运维工作有时会被认为是乏味且缺少技术含量的,因缺乏对必要知识的提纲挈领般的引导,很多运维同学难以快速地掌握运维的门道,而只能在忙碌和无奈中徘徊。感谢年年同学辛苦力作,将他广博的运维知识和对技术的深度思考、实践总结出来,深入浅出地带我们走进运维的世界。

  ——王春生 (@平凡的香草)新浪研发中心技术保障部高级技术经理

  中大型网站的运维工作牵扯较多且细节繁杂,需从一定高度来解决应对。弄清问题本质、根据相关技术原理探寻适合的方案、设计开发对应的平台系统和自动化工具,是资深运维人员的必备技能和目标追求。边喝着咖啡边把问题解决了或者由系统工具自动发现问题并修复,是理想的并且努力可以达到的场景。琛琳在自动化运维相关领域实战经验丰富,成绩斐然,本书是他多年工作的心血结晶,其中大量的代码、配置片段和软件方案给想进一步提高的运维工程师提出了一些思想思考或者说指引了前进方向。推荐有志青年仔细学习研究本书,共同把自动化运维推向一个新高度。

  ——张秀岭 (windtear) 人人公司高级技术专家

  读完这本书,惊叹于作者陈子(饶琛琳)渊博的知识和无私的分享精神。这本书是浩瀚的互联网技术知识海洋里的一张地图,每一章都像是一块大陆,虽不能从地图上看尽大陆的美丽风光,却能在一张纸上教会我们往哪里走可以到达目的地。更加难能可贵的是,这本书介绍的思想、软件和产品都是最新的,有着非常强的时效性和实用性。

  ——斯文(@小斯chinatopsquid) 百度系统部CDN资深研发工程师

  作者在CDN和大中型网站运维方面有着非常丰富的经验。本书成体系地讲解了运维工作中能使用到的方方面面,其中很多技术细节和方案是其他运维类技术书籍中很少提到的,看得出来都是作者多年实际经验的总结,非常值得相关的用户仔细研读。书中CDN 方面的一些应用,更是目前市面上的技术书籍中难能可贵的资料,值得研究和深入了解。从全书整体也可以看出作者出身于专业的 CDN 公司,因为像网站性能测试、日志收集处理、存储系统之类都是专业性非常强的。全书涉及知识点非常丰富,任何一个方面拿出来都可以单独出版成书。

——扶凯 音悦台系统运营总监

 

 

目录

《网站运维技术与实践》

第1 章 服务器监测 1

1.1 理解监测的意义 1

1.2 通过命令了解系统的性能概况 2

1.2.1 ifconfig 2

1.2.2 w 3

1.2.3 df 4

1.2.4 ps 6

1.2.5 vmstat 8

1.2.6 netstat 8

1.2.7 iostat 9

1.3 其他常用工具 13

1.3.1 sar 13

1.3.2 dstat 14

1.3.3 mtr 17

1.3.4 iptraf 18

1.3.5 tcpdump 19

1.3.6 wireshark 22

1.3.7 strace 23

1.3.8 stap 24

 

.1.4 smokeping 网络质量监测 34

1.4.1 原理 35

1.4.2 配置说明 37

1.4.3 报警 39

1.4.4 webui 40

1.5 nagios 分布式监测 41

1.5.1 架构原理 42

1.5.2 plugin 编写 45

1.5.3 snmp 网络监控 46

1.5.4 gearman 分布式 50

1.5.5 omd 介绍 55

第2 章 产品访问监测 57

2.1 关注产品比服务器更重要 57

2.2 网站监测的明星指标 58

2.2.1 可用性 58

2.2.2 响应时间 59

2.2.3 首屏响应时间 59

2.3 网页浏览过程简介 60

2.3.1 解析域名 60

2.3.2 连接服务器 61

2.3.3 发送请求 61

2.3.4 等待响应 63

2.3.5 传输响应内容 63

2.3.6 浏览器渲染处理 64

2.3.7 并发请求 64

2.4 浏览器网络监测与分析 65

2.4.1 firebug 65

2.4.2 chrome 开发人员工具 65

2.4.3 httpwatch 66

2.4.4 rvictl 接口监控ios 设备 67

2.4.5 har 格式 68

2.5 第三方监测 72

2.5.1 基调网络 72

2.5.2 监控宝 91

2.6 简单定制js 监测 92

2.6.1 页面内嵌js 92

2.6.2 nginx 日志记录和存储 93

2.6.3 数据展示 96

2.7 boomerang 96

第3 章 数据采集、传输与过滤 100

3.1 采集点的取舍 100

3.1.1 服务器数据 100

3.1.2 访问日志 101

3.1.3 系统日志syslog 102

3.2 收集传输 107

3.2.1 rsyslog 107

3.2.2 message queue 115

3.2.3 rpc 118

3.2.4 gearman 119

3.3 日志收集系统框架 122

3.3.1 flume-ng 122

3.3.2 logstash 125

第4 章 数据分析与报警 136

4.1 时间序列存储 136

4.1.1 rrdtool(round-robin database tool) 136

4.1.2 graphite 141

4.1.3 opentsdb 143

4.2 全文搜索引擎elasticsearch 144

4.2.1 简介 144

4.2.2 安装 145

4.2.3 集群 145

4.2.4 基础查询 146

4.2.5 优化 148

4.2.6 时间序列统计示例 152

4.3 数据可视化 156

4.3.1 rrdtool 156

4.3.2 gnuplot 160

4.3.3 amcharts 167

4.3.4 其他绘图库 176

4.4 报警 177

4.4.1 sendemail 177

4.4.2 websocket 178

4.4.3 手机推送 182

4.4.4 分级和归并 183

第5 章 测试评估 185

5.1 服务器性能测试 185

5.1.1 iozone 186

5.1.2 netperf 189

5.1.3 pktgen 193

5.1.4 sysbench 194

5.2 应用性能测试 197

5.2.1 http_load 197

5.2.2 ab 198

5.2.3 weighttp 201

5.3 分布式测试环境 202

5.3.1 autobench 202

5.3.2 tcpcopy 205

第6 章 集群架构规划 207

6.1 idc 的规划和选择 207

6.1.1 网站性质决定基础面 207

6.1.2 idc 厂商服务质量 208

6.1.3 bgp 真伪的验证 209

6.2 cdn 规划 213

6.2.1 cdn 原理 213

6.2.2 dns 原理 214

6.2.3 dns 查询结构实现 217

6.2.4 dns 调度 223

6.2.5 其他调度方法概述 227

6.2.6 动态加速概述 229

6.3 缓存设计 236

6.3.1 http header 对缓存的影响 236

6.3.2 squid 的lm-factor 过期算法 239

6.3.3 squid 的acl 控制 241

6.3.4 squid 的aufs/coss缓存引擎 243

6.3.5 squidclient 的运用 245

6.3.6 使用ssd 提高性能 250

6.4 本地负载均衡 255

6.4.1 lvs 负载均衡原理 255

6.4.2 keepalived 与vrrp 高可用原理 263

6.4.3 nginx 的upstream 268

6.4.4 squid 的cache_peer 272

第7 章 弹性控制和部署 274

7.1 配置集成的思想 274

7.1.1 抽象的集群管理 274

7.1.2 通用模式设计 275

7.2 操作系统部署kickstart 276

7.2.1 基本原理 277

7.2.2 配置安装 278

7.3 应用部署与配置管理 279

7.3.1 ssh::batch 279

7.3.2 puppet 282

7.4 搭建私有软件仓库 312

7.4.1 使用spec 文件构建rpm 包 312

7.4.2 命令行打包工具fpm 322

7.4.3 yum 私有仓库 324

7.5 随时控制成本 324

7.5.1 cgroup 配置简介 324

7.5.2 内存限制 328

7.5.3 cpu 共享限制 330

7.5.4 cpu 绑定限制 331

7.5.5 块设备读写限制 333

7.5.6 配合tc 完成网络限速 335

7.6 关于云计算 337

第8 章 分布式文件系统 339

8.1 nfs 339

8.1.1 原理 340

8.1.2 服务器端配置和优缺点 341

8.1.3 客户端参数优化 343

8.1.4 丢包与网络参数优化 346

8.2 简单易用的fuse 协议 348

8.3 mogilefs 351

8.3.1 gfs 介绍 351

8.3.2 mogilefs 介绍 353

8.3.3 mogilefs 内部原理 356

8.3.4 安装和配置 359

8.3.5 客户端配置和使用 363

第9 章 数据库 368

9.1 mysql 必知必会 368

9.1.1 常见sql 369

9.1.2 导入导出 370

9.1.3 简单配置调优 371

9.2 慢查询分析工具mysqlsla 372

9.2.1 使用 372

9.2.2 结果分析 373

9.3 percona 工具集 374

9.3.1 备份恢复工具xtrabackup 374

9.3.2 在线运维工具箱toolkit 376

9.3.3 监控插件集 379

9.4 监控工具 380

9.4.1 mytop 和innotop 380

9.4.2 orzdba 381

9.5 mysql 集群 384

9.5.1 mysql 复制原理 384

9.5.2 mha 原理 386

9.5.3 mha 安装使用 388

第10 章 备份与同步技术 390

10.1 rsync 390

10.1.1 原理 391

10.1.2 常见运用 393

10.2 inotify 和sersync 工具 396

10.2.1 inotify 概述和示例 396

10.2.2 sersync 介绍 397

10.2.3 sersync 配置用例 398

10.3 netcat 400

10.3.1 文件传输 400

10.3.2 端口扫描 401

10.3.3 远程控制 401

10.4 p2p 传输网络 402

10.4.1 p2p 协议概述 403

10.4.2 bittorrent 概述 405

10.4.3 murder 部署和运用 406

第11 章 运维制度化与自管理 408

11.1 运维制度化 408

11.1.1 运维为什么要制度化 408

11.1.2 运维如何制度化 409

11.1.3 sla(service level agreement)协议 409

11.1.4 故障处理的五问法 410

11.1.5 知识库 413

11.1.6 流程跟踪的tracker系统 425

11.2 自管理 431

11.2.1 时间管理 431

11.2.2 思维导图 433

11.2.3 git 管理和应用 434

11.2.4 交流与活动 445

 

本图书信息来源:互动出版网

 

你可能感兴趣的:(运维)