笙仔的所有評鑑

Elasticsearch in Action, Second Edition

Elasticsearch in Action, Second Edition

  • 會員評鑑等級
  • 評鑑日期:2024/04/25

在用慣了Apache Solr以及Splunk的工作環境下,一直沒有動力去使用Elasticsearch或是整合度更高的ELK(Elasticsearch、Logstash和Kibana)。即便ELK在大數據應用領域中有著不可忽視的優勢與地位,我先前也沒有動心起念要研究、導入這個解決方案。但隨著大數據資料收集的需求逐步增長,此時如果將不含商業價值的系統紀錄檔放在以容量計價的Splunk商品裡,不免讓人覺得像個富少般擺闊。此時開源、在限定條件下免費使用的ELK,儼然就是替代Splunk的最佳備胎。

由於ELK的開箱即用、橫向擴充架構以及它在資料收集、檢索的強大功能,容易讓人造成兩個迷思。一是公司導入ELK平台後,就是有了大數據的核心技術;二是使用ELK只要下一步、下一步點點點,藉由軟體預設值的協助,即使是初學者,三兩下也能建置好一套堪用的巨量資料查詢平台。這些迷思問題在於,ELK雖然是收集巨量資料的極佳方案,但對於資料運算上有它的侷限性,大概就是條件查詢、彙總等統計分析。無法做到像Hadoop/Spark大數據引擎般,用簡單、暴力的平行運算執行返覆的自訂邏輯。其次,ELK看似簡單易用,揭開面紗後是運用Kibana友善的Web介面,包裹Elasticsearch令人驚豔的分散式搜尋引擎。平台裡的所有資料收集、拆分與儲存、查詢與計算,都是Elasticsearch的核心功能。所以想要對ELK得心應手,非得對Elasticsearch下一番功夫,這也是我翻閱這本Elasticsearch in Action, Second Edition的起因。

想要透過閱讀來學會Elasticsearch像是在玩踩地雷遊戲,一不小心就會買到一本雷包書。主因是在Elasticsearch和ELK紅熱時的那些年,相關主題的書目,內容介紹的都是舊版本。不巧卻遇到Elasticsearch在6.x後的大改版,更動最核心的索引資料層級,捨去mapping type的設計,連帶修改了各種資料操作的API格式。這般大破大立的氣魄,除了讓已使用ELK的團隊得苦惱改版事宜,也注定出版社沒賣完的舊作只能丟到垃圾筒裡。這也使得Elasticsearch in Action在時隔多年後,得配合版本差異發行第二版。

全書詳盡完整地從資料欄位到索引分片等基礎講起,接著是花了近一半的篇幅介紹查詢語法,畢竟Elasticsearch是搜尋引擎,賣點是提供優質的資料查找機制。後續也有針對建置、管理議題提供相關的知識,讓讀者未來面對維運的課題時,能有基礎的能力。總結來說,想用好ELK平台,對於Elasticsearch這產品不能不深入瞭解,而目前在中外文出版品中,Elasticsearch in Action, Second Edition是編寫最用心、主題最全面的好書,推薦給有心想導入使用ELK平台的朋友們。

... 看更多

分享 

你覺得這篇書評有參考價值嗎?

島國毒癮紀事:那些在製販、司法、醫療、社區裡的用藥悲劇與重生

島國毒癮紀事:那些在製販、司法、醫療、社區裡的用藥悲劇與重生

  • 會員評鑑等級
  • 評鑑日期:2024/04/14

在華人社會,由於清末那場鴉片戰爭的歷史悲劇,社會大眾對毒品的態度都是深惡痛絕,對毒品吸食者是不假辭色地視為失敗者與亂源。檯面上看似歌舞昇平一片祥和之氣,事實是台灣的毒品問題已是烽火燎原,台灣已成為販毒集團銷至東北亞各國的樞紐,自己也未能免除其害,每年有高達四到五萬煙毒犯被逮捕。以提供優質深度報導成名的新媒體報導者團隊,對台灣毒品議題以點線面各維度探討,彙集成這本島國毒癮紀事,向讀者揭開台灣這塊土地上正遭遇的毒害挑戰。

隨著時代和社會環境的變遷,早年的毒王海洛因已經不再是最大宗的違禁毒品,取而代之的是能使勞動者處於精神亢奮的安非他命以及純粹用來狂歡娛樂的愷他命和大麻。這兩類性質截然不同的毒品,也反應出台灣施用毒品的最大兩類社會群體。一是屬於社經中下階級的重度勞力工作者,二是有錢有閒看似光鮮的派對玩樂咖。而他們的共同點都是對於施用毒品沒有罪識度以及病識度,都主觀認為自己能控制施用行為,不被毒品所制約,直到毒受已深、積重難返,才被周遭親友查覺,此時想戒斷更為艱難。

書中也詳盡探討台灣對反毒,在政策訂定時觀念上的反轉,不再追求治標,抓個案進監獄,而是朝向治本,朝向讓吸毒者能真正戒毒的目標努力。醫學研究指出毒品成癮後,確實會對人腦產生不可逆的物理毀壞,這也是成癮者為何那麼難戒斷毒癮的原因之一。另外,多數的毒品施用者都有嚴重的家庭問題,缺乏人際關係和社會聯結等現象。即便是娛樂用毒品的施用者,也是充斥著價值觀偏差,有躁鬱、憂鬱症傾向的問題。換言之,如果沒有徹底改善吸毒者們這些心魔,純粹只想通通把他們抓去關,那這些人出獄後,也只是重演再次犯禁的無限輪迴。

在政策上,台灣目前是以進步派的角度來看待看毒品問題,將大宗販毒謀利和吸毒者轉賣的罪刑予以區分,前者無庸置疑是萬國公罪,而對於後者應該多以病人兼之犯罪者的角度來處置。將毒蟲改稱做藥癮者也是一種去除汙名化毒犯的態度,讓社會大眾在與論上逐漸能接納改過自新的藥癮者。就像北風和太陽故事一樣,當社會一味地想把戒癮者推出去,他們只能重回毒品的懷抱。相對的,由於染毒後的戒斷是如此困難,更顯示出毒品對社會的危害有多可怕。也因此對於毒咖啡和大麻等軟性毒品,屬於容易讓青少年入門的違禁毒品,更要小心防範,須傾全力從教育與溯源方面除惡務盡。另外對於容易掛羊頭賣狗肉的電子煙商品,千萬別大意,這種吸食器可以直接混入成癮性精油,使人誤入歧途,應該嚴加控管。

... 看更多

分享 

你覺得這篇書評有參考價值嗎?

就為了好吃?:一位餐廳老闆的真心告白,揭開飲食業變成化工業的真相

就為了好吃?:一位餐廳老闆的真心告白,揭開飲食業變成化工業的真相

  • 會員評鑑等級
  • 評鑑日期:2024/04/11

此書評可能透漏關鍵情節

這年來一連串不曾間斷的食安事件,從瘦肉精、蘇丹紅到出了人命的寶林茶室,讓台灣的食品安全問題又成為社會大眾關注的焦點。曾幾何時食安爭議已經成為鬼打牆似的無限迴圈模式,由最初的事件發生眾人避之為恐不及,隨著時間拉長又遺忘在大家的記憶中。說到底,一味講究CP值的消費者,想要真正擺脫無良商人用不實、過期原料來販售食品,怎麼都讓人覺得是緣木求魚。就為了好吃的作者林朗秋夫婦抱持著理想主義,用近七年的時間與精力經營一家強調有機、在地的素食餐廳食在地台灣素食堂,雖然已在2020年黯然倒閉,但是他沒浪費這段人生經歷,在結束餐飲事業後,他將對台灣飲食業的見聞與看法,整理成這本平易近人的佳作,讓讀者一探台灣飲食業心知肚明又不敢告訴客人的事。

從日本人在海帶水產品提煉出味素主打鮮味後,在台灣料理中所處可見味精這一古早味。而後這項技術又演進成雞湯粉、大骨粉以及牛肉高湯粉。台灣人最愛的各式火鍋和時下年輕人熱衷的拉麵,湯鮮味美的背後有可能就是各種化學調味料加熱水的神奇魔法。不信?仔細觀察一下店家每天丟出來的廚餘裡是否有成比例的熬湯食材。

在一說防腐劑就聞之色變的今天,食物保鮮劑卻以另一種形式,登堂入室地大舉進入消費者的口中。不論是超商的鮮食或便當,還有保存期限多達數天的麵包與糕點,它們都透過你我唸不出來的化合物,來增長食品外觀不走樣的時效。然而食物外表的變色是大自然讓我們判斷食物是否酸敗的方法,不會變色的食物不表示不會腐敗,更可能讓消費者吃下已酸敗的食物。

辣椒添加蘇丹紅的食安事件,讓消費者得知食用色素已經鋪天蓋地使用在各種食材原物料裡。但還不僅於此,定色、定味和增稠都是食品添加劑的應用範圍,而你我接觸最多的來源就是隨手可得的飲料。不論是看似健康的果汁、優酪乳,還是解膩古早味的青草茶、烏梅汁。這些五花八門的包裝飲品背後,都是一大票認不出的化學添加物。加上店家成本考量下又用玉米糖漿/果糖來取代蔗糖,廠商賺飽飽的產值背後,代價是台灣年年創新高的糖尿病和腎病人口。

一般人對油品的製程並不瞭解,原來油品依製程可粗略分成初榨冷壓,就是將種籽清洗後,在常溫下壓榨出油,這種油品最天然,但要留心原料要是有機等級,不然反而會吃進更多農藥,代表油品為橄欖油;熱壓,將原料放入高溫高壓的螺旋機器中榨取熱壓油,代表油品是芝麻榨出的麻油、香油和花生榨取的花生油,或是初榨橄欖油;化學萃取利用乙醚或乙烷等溶脂又易揮發的化學特性,將原料中的油脂提煉出來,再利用減壓分離技術取出高純度的油品,代表油品是便宜常見的大豆沙拉油、葵花油、純橄欖油和對人體有害的棕櫚油、棉籽油。

在台灣外食,最容易踩到的兩個地雷是豆製品和醬油。豆製品從是不是基改黃豆,到製程時可能被添加的防腐劑、漂白劑,還有基本上根本躲不掉的消泡劑。不論是豆漿、豆皮、豆腐還是豆干,想要找到十足天然不額外添加化學成份的良心豆腐店,還是有,可以參考書中介紹的店家。最近剛好發生東成醬油有非自家釀造的醜聞,恰好曝露出台菜裡最核心的調味料醬油其實水很深。別說什麼純釀造,外面許多小吃店、攤販所用的,根本只是加了色素(還不見得是食用色素)的鹽巴水。有良心一點的會使用桶裝醬油,像是魯味攤和熱炒店這種用量大的,十之八九都是加了人工甘味劑的化學醬油。

就為了好吃?薄薄一本但內容相當多元,除了上述整理的外食的食安問題外,也包含林朗秋對現代人在飲食習慣上的一些觀察,像是重口味、愛吃甜、把錢都花在手搖杯上,以及不喜歡吃蔬菜。最後一部份是介紹很多深耕土地,憑良心做事的食品廠和小農。對於想要吃到最天然、無毒食材的讀者們,也可以按書索記去拜訪這些業者,找到自己心目中最安心的食材。

... 看更多

分享 

你覺得這篇書評有參考價值嗎?

逆轉人生

逆轉人生

  • 會員評鑑等級
  • 評鑑日期:2024/03/24

不經意在有線電視頻道上轉到逆轉人生這部電影,看到妮可基嫚徐娘半老扮演俏麗女秘書依舊亮麗動人。這部描述金字塔頂端的富翁,因飛行傘意外後全身癱瘓,卻意氣用事聘請算是社會邊緣人的有色人類看護。在許多曲折互動後,位於社會階級正負極端的兩人,卻建立起意外之外的友情與牽絆。全片劇情流暢又略帶幽默插曲,一晃神就把全片看完,看到片尾字幕寫著改編自真貫故事與原著逆轉人生,不經想把原作拿來翻翻看。

原來美國的逆轉人生電影是翻拍自法國電影第二人生,故事中的主人翁菲利普是位出生名門世家貨真價值的法國貴族。而他口中的惡魔看護阿布戴則是來自阿爾及利亞,是一位熟知低層社會生存法則的街頭硬漢,習慣用上勾拳教導陌生人啥叫禮貌。由於作者僅剩頸部以上有知覺,所以全書是用錄音和眨眼選字撰寫而成。脊椎受損後引起周邊神經痛的後遺症,所以即便電影裡的菲利普已經讓人心生憐憫,真實世界裡的他更是有如活在煉獄。

長久的知覺喪失以及不曾間斷、突如其來的劇烈疼痛,讓作者的意識很難像常人般持續地維持穩定。有如書裡的前言,長期的痛苦粉碎了菲利普的記憶力。所以雖然逆轉人生試圖以一本回憶錄的形容書寫,但全書內容是夾雜著記事與天空行馬的喃喃自語,描繪出作者從小到大的經歷、與摯愛的相知相惜,以及元配罹病、自己癱瘓、摯愛因病離世等等一連串生命旅程中的刻痕。菲利普充沛的情感與多彩多姿的回憶是肥沃的養份,孕育出全篇華美而奇幻的文字,有如蒲公英般迎風飛起,超越有形的驅體侷限,散落在全世界有緣翻閱的讀者心頭。

... 看更多

分享 

你覺得這篇書評有參考價值嗎?

來自土耳其的邀請函:吳鳳帶路!橫跨歐亞文明私旅

來自土耳其的邀請函:吳鳳帶路!橫跨歐亞文明私旅

  • 會員評鑑等級
  • 評鑑日期:2024/03/22

說到土耳其,你想聯想到的是淡水老街裡逗趣老外賣的土耳其冰淇淋,還是那首由周杰倫創作同名的流行歌,或是現在夜市裡已經少見的土耳其美食沙威瑪?說真的,對多數的台灣人來說,對土耳其這個國家的印象,大概僅限於這些支微末節的事物。

而這本由藝人吳鳳主筆的來自土耳其的邀請函,先以旅遊資訊為賣點,大篇幅介紹土耳其這個有台灣二十二倍大的國家裡許多值得一遊的景點。再加入土式習俗和土式料理的概略介紹,最後則是整理土耳其建國與現代化的歷史,可以讓讀者在翻完本書後,由裡到外對土耳其有個粗淺但全面的瞭解。如同吳鳳所說,每個人在海外都是一位代表母國的潛在大使,他確實藉由這本書,向台灣讀者做了一次優質的土國外交。

土耳其由於獨特的地理位置,國土涵蓋歐、亞兩洲,物產豐饒又處於黑海與地中海咽喉處,也因此自有文明以來都是各國覬覦的對象。這個在中國歷史上被稱為突厥人的遊牧民族,有著近二千年的文明。經歷過羅馬帝國、魯姆蘇丹國和鄂圖曼帝國的統治,所以這片土地上隨處可見各個古文明興盛過的痕跡,諸如希臘神廟遺址、羅馬浴場與競技場、基督教的聖母院和大教堂、伊斯蘭教的清真寺以及鄂圖曼建築。令人吃驚的是,土國境內還有希臘神話眾神所居住的領地以及傳說裡製造諾亞方舟的地點!另外跨越兩洲的國土有著極長的海岸線,由於保護得宜未經工業化破壞,海邊城市的郊區都有相當優質的海灘可去戲水。四季分明的自然景觀也是土耳其吸引全球觀光客的一大賣點,逛膩了歐美日?下次去土耳其走走吧,別忘記帶著這本來自土耳其的邀請函呦。

... 看更多

分享 

你覺得這篇書評有參考價值嗎?

漫畫行為經濟學 不理性錯了嗎?:為什麼總是忍不住湊免運?23堂讓你不再吃虧的思考啟發課

漫畫行為經濟學 不理性錯了嗎?:為什麼總是忍不住湊免運?23堂讓你不再吃虧的思考啟發課

  • 會員評鑑等級
  • 評鑑日期:2024/03/17

宏觀的經濟學總是強調人們的經濟決策是奠定在理性分析後的行為,然而在日常生活中你我卻可以發現到數不盡的非理性消費行為。漫畫行為經濟學就是用聚焦到個人的行為經濟學,解釋社會大眾常見的消費心理,從大家最熟知的錨定效應到足以改變做事熱忱的削弱效應,書中共提及二十三項非理性的心理作用,用日本味特濃的漫畫形式呈現給讀者,真正地達成寓教於樂的理想。不論是題材挑選、故事鋪陳以及圖畫繪製,都能感受到日本人做事特有的嚴謹與細緻。

而行為經濟學這學問對許多從事商業活動的經營者和從業人員來說,更是一門值得接觸與學習的知識。我們可以觀察到,會在第一線直接面對消費者的零售和服務業者,已經相當熟練地運用書中提及的非理性消費心態,像是刻意將定價拉高再給予折扣的錨定效應,推廣企業購物金/儲值金讓消費者在不經意中多花錢的心理帳戶等等。瞭解並熟習行為經濟學會有雙重的好處,首先在日常生活中你我會變身為更睿智的消費者,避免誤入許多精心設計的消費陷阱。矛盾的是,當做為經營者時,活用這些非理性消費心理,才能讓我們設計出比競業更具優勢的交易模式,讓消費大眾誤入我們的懷抱。

市面上從來不缺企管與行銷類的新書,即便是談論消費者心理的書也是汗牛充棟。但對一般讀者來說,如果行為經濟學的書是動輒二、三百頁的專論與分析,那肯定不會在茶餘飯後拿來翻閱。漫畫行為經濟學恰好可以填補這塊在求知需求與投入精力的落差,讀者能用最輕鬆的心情吸收有關消費心理的盲點,說不定會從中領略出意想不到的商機,本小利大,可為也!

... 看更多

分享 

你覺得這篇書評有參考價值嗎?

古人教你混職場:諸葛亮如何規畫「就職三部曲」?蘇東坡怎麼和同事婉轉say no?30則古代一哥的智慧絕活,帶你輕鬆走跳江湖!

古人教你混職場:諸葛亮如何規畫「就職三部曲」?蘇東坡怎麼和同事婉轉say no?30則古代一哥的智慧絕活,帶你輕鬆走跳江湖!

  • 會員評鑑等級
  • 評鑑日期:2024/02/25

雖然大家的夢想都是財富自由,但事實上除了少數人走上自營業當小老闆外,大多數人每日還是得為五斗米折腰地當個受薪階級。而人在江湖走,那有不挨刀,做上班族最難的永遠不是做事,而是做人。古人教你混職場是一本借鑿中國歷代古人的行言舉行,取其好的一面,指導讀者面對職場上的風風雨雨。典故橫跨春秋戰國到清朝,收錄許多家喻戶曉的名臣將相,雖然現代人在職場上會遇到的齟齬和困頓,相較與君臣相處時的膽戰心驚全然是雲泥之別的壓力。但宦海沉浮的本質也是人際關係應對的考驗,殊途同歸地指向一些為人處事的定理,截錄在書中的各篇故事裡。

管理上級靠情商、Hold住同事靠德商和提升自我靠逆商全書以這三章,分別整理了職場螺絲釘在面對主管、同事和自身職涯的種種課題,有什麼能見賢思齊的炒招可以如法炮製。對於上級長官,首重能贏在起跑點的選對公司跟對人,也就是選培飬自己看產業、看人的眼光。退而求其次,就是學習如果做好一位稱職的部屬。忠誠和能力以及遵守上下間的分際永遠是不退流行的摩西十戒。而面對職等相近又隱含競爭關係的同事相處,在講究分工合作的現代職場,要拿捏處事分寸更是得多加琢磨。簡單歸納的大原則是追求互助共贏和親君子而遠小人。如果長期職場處在緒事不順亢龍有悔的情境,書中也列舉很多漂亮轉身的成功名人典故。說實話,一般人和人之間的聰明才智都差異不太,而面對逆境時的抗壓性和彈性思維才是決定誰能跑到比賽終點的關鍵。即便是2024年此時,全世界都異口同聲讚嘆其成就的輝達創辨人黃仁勳,也是歷經許多經營挑戰持續堅持不懈才有今日的豐功偉業。

這幾年心理勵志和職場關係的書目,榜行排上的常客,多是迎合做自己和厚黑學的大潮流。這本古人教你混職場則是反其道而行,它告訴的處事原則相當正面而富有積極向上的人生價值。相當符合儒家思想的君君臣臣父父子子,擁抱西方個人主義的時下年青人應該很難對書中的建議照單全收,不過如何好好活出有意義的人生這個命題未來就沒有標準答案,陳言老舊的讀聖賢書,所學何事,絕對也是社會上某群人的人生終極目標。

... 看更多

分享 

你覺得這篇書評有參考價值嗎?

TOBY漫畫夜市美食(台北篇)

TOBY漫畫夜市美食(台北篇)

  • 會員評鑑等級
  • 評鑑日期:2024/02/14

自網路世代興起後,吸引眾人目光的形式也不斷變化,從最早期的Blog圖文內容,到先前的Vlog影音內容,最近則又進化為TikTok短影音。這本Toby漫畫夜市美食台北篇是2006年新浪網百萬部落客的圖文創作,截取台北各大知名夜市的重點攤位的採訪過程,以寫真又不失俏皮的繪畫風格,呈現令人垂延三尺的銅板美食。

饒河夜市想當然耳得介紹天字第一號名店的胡椒餅,另外還有甘泉豆花,這間就不知收了沒(畢竟現在是2024年了)?針對外國觀光客熟知的士林觀光夜市,作者挑選較多知名小吃,包含吉利生炒花枝、蚵仔煎,已經變成連鎖店的豪大炸雞排以及其它夜市找不到的特色小食大餅包小餅,最後一家的阿忠冰店則是讓人覺得可能已休業的店家。師大夜市的燈籠滷味和阿諾可麗餅是目前還在營業的長青名店,不過掌廚的老闆不知已換過幾任,希望口味有傳承下去。景美夜市的上海生煎包依舊是當地的扛霸子,排隊人龍絡繹不絕,這種偏向家庭式經營的老牌店家,反而能維持著古早味。華西街觀光夜市內老字號美食數不清,作者僅挑了一家源芳割包做終結,主因是他和老老闆有過互動,所以對該店別有印象。

翻閱一本2006年出版的美食圖文書,當然不會傻傻地認為可以按圖檢索去品嚐書中的美食小吃,畢竟都是快二十年前的舊聞了。看這本書主要是欣賞作者在漫畫上的故事和描繪,Toby的畫技相當不俗,不論是寫真的場景還是烹飪區的立體圖,都可以看出他扎實的手繪功力。江山代有才人出,一代新人換舊人,隨著大眾的喜好轉變,知名內容創作者也不斷更迭,是必然的宿命吧。畢竟不是每個人都是劉德華或阿湯哥,可以紅個三、四十年。

... 看更多

分享 

你覺得這篇書評有參考價值嗎?

我是一個媽媽,我需要柏金包!:耶魯人類學家的曼哈頓上東區臥底觀察(暢銷新裝版)

我是一個媽媽,我需要柏金包!:耶魯人類學家的曼哈頓上東區臥底觀察(暢銷新裝版)

  • 會員評鑑等級
  • 評鑑日期:2024/02/12

由於首都台北寸土寸金的房價,以及台北居大不易的民生物價,因而產生嘲諷台北人像航海王漫畫裡的天龍人般,將台北市稱呼做天龍國的流行詞彙。而如果你曾有在信義區或東區逛街壓馬路的經驗,應該也遇過許多全身上下都是名牌,妝髮精緻無暇,眼神中卻透露著一附閒人勿近,你們不配和我呼吸同一種空氣的傲慢態度。一直無法體會這群人是處於哪種精神狀態,為何能散發出如此自負而惹人厭的氣場。

在看過我是一個媽媽,我需要柏金包!,作者在世界級的天龍國(紐約上東區)得所見所聞後,確切地明白那些生活在金字塔最頂端的人們,是處於一個普羅大眾無法想像的壓力鍋中。雖然免除了市丼小民在材米油鹽等金錢問題的困擾,但人們就是種會自尋煩惱的生物,追求同儕團體的認同、相互攀比彰顯地位,以及對未來財富能否持續的焦慮,都能這些天之驕子夜不成眠。爭先恐後地購買最新款的名牌包,也只是要突顯能為人不能的優越感,是一場證明我比你行的財力火拼遊戲。

溫絲黛.馬丁以她風趣幽默的文筆,加之對社會學鄉野調查的熱情,把自己搬入紐約上東區嘗試嘗融入地方媽媽社群的經驗,撰寫成這本足以讓人笑掉大牙的社普書。隨著她一步步貼近深入貴婦圈的進程,說明了圈內獨有的潛規則與人際相處模式,讓讀者們能見識見識貴婦們的喜樂與哀愁。也讓你我有機會轉念體認到,再多的柏金包也不會是幸福生活的保證,無盡的欲求才是苦難的開端。

... 看更多

分享 

你覺得這篇書評有參考價值嗎?

大數據(新版):「數位革命」之後,「資料革命」登場: 巨量資料掀起生活、工作和思考方式的全面革新

大數據(新版):「數位革命」之後,「資料革命」登場: 巨量資料掀起生活、工作和思考方式的全面革新

  • 會員評鑑等級
  • 評鑑日期:2024/01/30

從2015年開始接觸Hadoop平台以來,一直專職在大數據應用和電商推薦系統。有趣的是,一路上我一直沒看過這本幾乎被視為巨量資料聖經的大數據,理由挺傲嬌的,那時心想「如果看了這本書,作法說不定會被引導,而走不出自己的路…」。而為什麼在2024年的今天會動心起念想看這本大數據?原因是經過這些年在大數據的專研與實務經驗,中間遇到許多困難與挑戰,累積自身對這個資訊應用領域的觀點與看法。這時來吸收業界先進的思維與方針,才不會一味的照單全收,更能淬鍊出書中的真知灼見,滿載而歸。

不知你有沒有發現,在新聞報導裡只要有用到數據分析的情況,一律要說是大數據分析。然而怎麼樣的資料才能叫大數據?GB?TB?PB?用單純的資料容量大小適合嗎?答案當然是NO。樣本=母體,在巨量資料的三大特質中,這是最具體能區分傳統的統計分析和巨量資料分析的差異。書中明確的指出,在過去,資料搜集、儲存、處理成本相對高昂,抽樣是一門相當重要的學問,能有效地將分析成本壓低到最小,讓數據分析可以充分應用在各個社會科學和商業領域。以抽象的理論為起點,針對假說進行取樣蒐集資料,最後再針對資料進行相關性分析,是傳統統計學門的標準作業流程。但在資料爆炸的網路時代,加上各種開源的大數據工具蓬勃發展,以母體資料來進行統計分析不再是天方夜談的空想。雖然資料科學家的專業知識,被認為由統計分析、數據工程和資料視覺化三個領域交集而成。在實務操作時統計分析這塊著墨的深度,尚不如其它兩者,大約有基礎的統計能力即可應付一般需求。也如同作者而言,大數據分析十之八九不會用到抽樣技術。

而在巨量資料喊得震天價響的幾年之後,多數企業卻發現大數據帶來的影響並不顯著。首先,不是每個企業都能獲取巨量資料,因此頂多只能扮演資料運用的角色。再者,巨量資料先天的雜亂(或說不精確)特質,如果想廣泛運用,得打破企業運營對數字吹毛求疵的傳統,更讓經營決策高層裹足不前,敬而遠之。因此在企業界,能看到的大數據成功案例,多是打造更優秀的機制、工具,屬於戰術性質,很少看到企業以巨量分析的數據當做訂定戰略方向的核心指標。即便如此,張開雙手擁抱資料數量比資料品質更重要,就促成了更準確的谷歌翻譯模型、亞馬遜推薦系統等,這些都是由簡單的模型加上大量資料,卻打敗複雜但資料量少的模型的例子。

相關性不等於因果關係是反智一書裡耳提面命的重要觀念。然而大數據運用卻是要你張開雙手擁抱相關性,別在拘泥在因果關係。像是在推薦系統中效果最顯著的購物籃分析和谷歌的關鍵字預測流感趨勢等例子,都是利用正是如此,而非苦思為何如此。對理論假說進行實驗設計,以控制組和對照組的資料進行因果關係分析,是科學知識賴以累積的碁石。但大數據的分析思維並不追求這種費時秏工的科學精神,利用低成本的相關性分析,應用在追求成果最大化的領域中(例如商業、政策),就能獲取超乎想像的回報。而相關分析和因果分析也絕不是互斥對立的觀點,有效地利用相關分析當做操作變數的過濾器,可以減少未來要進行實驗設計的變數項目。大數據運用裡的預測分析則是以更積極的態度來運用相關性,利用高度相關性的變數做為想預知事項的有效指標,例如異常的刷卡結帳頻率可能是盜刷。所以想用大數據來找出流失客戶的原因這個命題是有問題的,因為巨量數據分析是找出相關性,並無法真正的找出因果關係,想找到原因得用問券調查和實驗設計等傳統科學作法。

除了上述說明大數據三項特質的豐富內容外,書中也進一步對資料的數位化和資料化間的差異提出說明。也因為數位資料是經濟學者所謂的非競爭商品(某人的使用不妨礙他人使用),所以針對同一份巨量資料的無限制次數運用是可行的。一但出現新的運用觀點,既可對舊有的資料進行再次利用。也可和其它外部資料重新組合、在資料蒐集的過程中額外取得其它面向的資料,都是增進巨量資料價值的具體作法。讀完大數據會深刻領悟,巨量資料像是取之不盡的太陽能,照亮著數據分析的現在與未來。

... 看更多

分享 

你覺得這篇書評有參考價值嗎? [ 1 人中有 1 人(100%) 覺得這篇評論有參考價值 ]

2112345678910下一頁 跳到