由於ELK的開箱即用、橫向擴充架構以及它在資料收集、檢索的強大功能,容易讓人造成兩個迷思。一是公司導入ELK平台後,就是有了大數據的核心技術;二是使用ELK只要下一步、下一步點點點,藉由軟體預設值的協助,即使是初學者,三兩下也能建置好一套堪用的巨量資料查詢平台。這些迷思問題在於,ELK雖然是收集巨量資料的極佳方案,但對於資料運算上有它的侷限性,大概就是條件查詢、彙總等統計分析。無法做到像Hadoop/Spark大數據引擎般,用簡單、暴力的平行運算執行返覆的自訂邏輯。其次,ELK看似簡單易用,揭開面紗後是運用Kibana友善的Web介面,包裹Elasticsearch令人驚豔的分散式搜尋引擎。平台裡的所有資料收集、拆分與儲存、查詢與計算,都是Elasticsearch的核心功能。所以想要對ELK得心應手,非得對Elasticsearch下一番功夫,這也是我翻閱這本Elasticsearch in Action, Second Edition的起因。
想要透過閱讀來學會Elasticsearch像是在玩踩地雷遊戲,一不小心就會買到一本雷包書。主因是在Elasticsearch和ELK紅熱時的那些年,相關主題的書目,內容介紹的都是舊版本。不巧卻遇到Elasticsearch在6.x後的大改版,更動最核心的索引資料層級,捨去mapping type的設計,連帶修改了各種資料操作的API格式。這般大破大立的氣魄,除了讓已使用ELK的團隊得苦惱改版事宜,也注定出版社沒賣完的舊作只能丟到垃圾筒裡。這也使得Elasticsearch in Action在時隔多年後,得配合版本差異發行第二版。
全書詳盡完整地從資料欄位到索引分片等基礎講起,接著是花了近一半的篇幅介紹查詢語法,畢竟Elasticsearch是搜尋引擎,賣點是提供優質的資料查找機制。後續也有針對建置、管理議題提供相關的知識,讓讀者未來面對維運的課題時,能有基礎的能力。總結來說,想用好ELK平台,對於Elasticsearch這產品不能不深入瞭解,而目前在中外文出版品中,Elasticsearch in Action, Second Edition是編寫最用心、主題最全面的好書,推薦給有心想導入使用ELK平台的朋友們。