新到貨2本75折
SRE:Google運維解密

SRE:Google運維解密

  • 定價:768
  • 運送方式:
  • 臺灣與離島
  • 海外
  • 可配送點:台灣、蘭嶼、綠島、澎湖、金門、馬祖
  • 可取貨點:台灣、蘭嶼、綠島、澎湖、金門、馬祖
載入中...
  • 分享
 

內容簡介

大型軟件系統生命周期的絕大部分都處於「使用」階段,而非「設計」或「實現」階段。那麼為什麼我們卻總是認為軟件工程應該首要關注設計和實現呢?

在本書中,Google SRE的關鍵成員解釋了他們是如何對軟件進行生命周期的整體性關注的,以及為什麼這樣做能夠幫助Google成功地構建、部署、監控和運維世界上現存很大的軟件系統。

通過閱讀本書,讀者可以學習到Google工程師在提高系統部署規模、改進可靠性和資源利用效率方面的指導思想與具體實踐——這些都是可以立即直接應用的寶貴經驗。任何一個想要創建、擴展大規模集成系統的人都應該閱讀本書。

本書針對如何構建一個可長期維護的系統提供了非常寶貴的實踐經驗。

Betsy Beyer是Google 紐約負責SRE的一名技術文檔作家。她之前曾為遍布全球的Google數據中心與Mountain View硬件運維團隊編寫文檔。在搬到紐約之前,Betsy是Stanford大學技術性寫作課程的講師。她曾經學習國際關系與英文文學,並在Stanford和Tulane獲得學歷。

Chris Jones是Google App Engine的一名SRE。Google App Engine是一個PaaS 服務,每天處理超過280 億個請求。他的辦公室在舊金山,他之前的工作包括Google廣告統計、數據倉庫,以及用戶支持系統的維護。在之前,Chris曾經在學校IT行業任職,同時參與過競選數據分析,以及一些BSD內核的修改。他有計算機工程、經濟學,以及技術政策學的學位。同時他也是一名有執照的職業工程師。

Jennifer Petoff 是Google SRE團隊的一名項目經理,工作地點在都柏林,愛爾蘭。她曾經負責管理大型全球項目,包括:科學研究、工程、人力資源,以及廣告等。Jennifer在加入 Google之前,曾在化工行業任職八年。她獲得了Stanford大學的化學博士與學士學位,同時她還擁有Rochester大學的心理學學位。

Niall Murphy 是Google 愛爾蘭團隊廣告SRE的負責人。他擁有20年互聯網行業經驗,目前是INEX(愛爾蘭網絡互聯樞紐)的主席。他曾經寫作以及參與寫作很多科技文章與書籍,包括O』Reilly出版的IPv6 Network Administration,以及很多RFC。他目前在參與書寫愛爾蘭互聯網發展史。他擁有計算機科學、數學,以及詩歌學的學歷(他當時一定是想錯了!)。他目前與妻子和兩個兒子居住在都柏林。
 

目錄

前言
序言
第Ⅰ部分概覽
第1章介紹2
系統管理員模式2
Google的解決之道:SRE4
SRE方法論6
確保長期關注研發工作6
在保障服務SLO的前提下很大化迭代速度7
監控系統8
應急事件處理8
變更管理9
需求預測和容量規划9
資源部署10
效率與性能10
小結10
第2章Google生產環境:SRE視角11
硬件11
管理物理服務器的系統管理軟件13
管理物理服務器13
存儲14
網絡15
其他系統軟件16
分布式鎖服務16
監控與警報系統16
軟件基礎設施17
研發環境17
莎士比亞搜索:一個示范服務18
用戶請求的處理過程18
任務和數據的組織方式19
第Ⅱ部分指導思想
第3章擁抱風險23
管理風險23
度量服務的風險24
服務的風險容忍度25
辨別消費者服務的風險容忍度26
基礎設施服務的風險容忍度28
使用錯誤預算的目的30
錯誤預算的構建過程31
好處32
第4章服務質量目標34
服務質量術語34
指標34
目標35
協議36
指標在實踐中的應用37
運維人員和最終用戶各關心什麼37
指標的收集37
匯總38
指標的標准化39
目標在實踐中的應用39
目標的定義40
目標的選擇40
控制手段42
SLO可以建立用戶預期42
協議在實踐中的應用43
第5章減少瑣事44
瑣事的定義44
為什麼瑣事越少越好45
什麼算作工程工作46
瑣事繁多是不是一定不好47
小結48
第6章分布式系統的監控49
術語定義49
為什麼要監控50
對監控系統設置合理預期51
現象與原因52
黑盒監控與白盒監控53
4個黃金指標53
關於長尾問題54
度量指標時采用合適的精度55
簡化,直到不能再簡化55
將上述理念整合起來56
監控系統的長期維護57
BigtableSRE:警報過多的案例57
Gmail:可預知的、可腳本化的人工干預58
長跑59
小結59
第7章Google的自動化系統的演進60
自動化的價值60
一致性60
平台性61
修復速度更快61
行動速度更快62
節省時間62
自動化對GoogleSRE的價值62
自動化的應用案例63
GoogleSRE的自動化使用案例63
自動化分類的層次結構64
讓自己脫離工作:自動化所有的東西66
舒緩疼痛:將自動化應用到集群上線中67
使用Prodtest檢測不一致情況68
冪等地解決不一致情況69
專業化傾向71
以服務為導向的集群上線流程72
Borg:倉庫規模計算機的誕生73
可靠性是最基本的功能74
建議75
第8章發布工程76
發布工程師的角色76
發布工程哲學77
自服務模型77
追求速度77
密閉性77
強調策略和流程78
持續構建與部署78
構建78
分支79
測試79
打包79
Rapid系統80
部署81
配置管理81
小結82
不僅僅只對Google有用83
一開始就進行發布工程83
第9章簡單化85
系統的穩定性與靈活性85
乏味是一種美德86
我絕對不放棄我的代碼86
「負代碼行」作為一個指標87
最小API87
模塊化87
發布的簡單化88
小結88
……
第Ⅲ部分具體實踐
第Ⅳ部分管理
第Ⅴ部分結束語
附錄A系統可用性411
附錄B生產環境運維過程中的佳實踐412
附錄C事故狀態文檔示范417
附錄D事后總結示范419
附錄E發布協調檢查列表423
附錄F生產環境會議記錄示范425
參考文獻427
索引439
 

詳細資料

  • ISBN:9787121297267
  • 規格:450頁 / 普通級 / 1-1
  • 出版地:中國

最近瀏覽商品

 

相關活動

  • 【科普、飲食、電腦】高寶電子書暢銷書展:人生就是選擇的總和,全展75折起
 

購物說明

溫馨提醒您:若您訂單中有購買簡體館無庫存/預售書或庫存於海外廠商的書籍,建議與其他商品分開下單,以避免等待時間過長,謝謝。

大陸出版品書況:因裝幀品質及貨運條件未臻完善,書況與台灣出版品落差甚大,封面老舊、出現磨痕、凹痕等均屬常態,故簡體字館除封面破損、內頁脫落...等較嚴重的狀態外,其餘所有商品將正常出貨。 

 

請注意,部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

調貨時間:若您購買海外庫存之商品,於您完成訂購後,商品原則上約45個工作天內抵台(若有將延遲另行告知)。為了縮短等待的時間,建議您將簡體書與其它商品分開訂購,以利一般商品快速出貨。 

若您具有法人身份為常態性且大量購書者,或有特殊作業需求,建議您可洽詢「企業採購」。 

退換貨說明 

會員所購買的商品均享有到貨十天的猶豫期(含例假日)。退回之商品必須於猶豫期內寄回。 

辦理退換貨時,商品必須是全新狀態與完整包裝(請注意保持商品本體、配件、贈品、保證書、原廠包裝及所有附隨文件或資料的完整性,切勿缺漏任何配件或損毀原廠外盒)。退回商品無法回復原狀者,恐將影響退貨權益或需負擔部分費用。 

訂購本商品前請務必詳閱商品退換貨原則

  • 翦商作者新作79折
  • 針灸匠張寶旬
  • 浪漫小說精選3本72折