讀書日
內容連載 頁數 1/5
【第八章 大數據裡沒有新東西?──淺談資料探勘的新風貌】(節錄)
 
什麼是資料探勘?從資料裡挖掘資訊的過程
 
對於沒有資訊背景的人來說,「資料」與「資訊」的分野常常令人困惑。坊間許許多多的課本都會嚴肅地做出一堆定義性的解釋。但我會想要很直接的這麼說:如果我在紙上寫下0928280356這個數字,它就是一筆「資料」,我想就算完全沒有資訊背景的人都會聽過「資料庫」這個名詞,到底什麼是資料庫?其實你的隨便一個excel表單都可以說是一個「格式還不夠嚴謹,但是具體而微的資料庫」,就因為裡頭儲存了大量的資料,就像我剛剛隨口舉例的0928280356一樣,它可能靜靜地躺在資料庫裡的某個角落。最多,敏感一點點的人會猜測它是某個人的手機號碼。
 
可是如果我說,它是林志玲的電話號碼的話,想必有很多男性同胞眼睛一亮!(但當然不是,請千萬別當真,如果有人真的在使用這個門號而收到騷擾電話的話,筆者對您感到萬分抱歉),所以「產生意義的資料」就叫作「資訊」。資訊的定義就更廣闊了,它更不限於單筆的資料,而有可能是「一堆資料的集合」。
51 2 3 4 5 下一頁 跳到