從資料集識別獨一無二的特徵,
建構功能強大的機器學習系統!
特徵工程(Feature Engineering)是建立強大機器學習系統的首要步驟,也是最重要的步驟。特徵選擇錯誤,甚至可能使得某些機器學習演算法毫無用處。故而特徵工程可說是機器學習的重中之重。本書將帶你了解特徵工程的完整流程,讓機器學習更有系統、更有效率。
你將從理解資料(data)開始學習。機器學習模型的成功之處,正是取決於如何利用不同類型的特徵,例如:連續特徵、分類特徵等等。透過理解錯誤分析和模型的可接受性,你將了解何時該納入一項特徵、何時又該忽略一項特徵,以及其中的原因。你還會學習如何將問題陳述轉換為有用的新特徵、如何提供由商業需求和數學見解驅動的特徵,以及如何在自己的機器上進行機器學習,進而自動學習資料中的特徵。
適用讀者
本書適合所有希望全面了解特徵工程的讀者,特別適合具有機器學習應用知識並希望改進機器學習模型結果的資料科學家。讀完這本書,讀者將能精通特徵選擇、特徵學習和特徵最佳化!
在這本書中,你將學到:
・ 識別和利用不同類型的特徵
・ 清洗資料中的特徵,提升預測能力
・ 了解為何以及如何進行特徵選擇和模型誤差分析
・ 利用領域知識建構新特徵
・ 以數學知識為基礎並交付特徵
・ 使用機器學習演算法建構特徵
・ 精通特徵工程與特徵最佳化
・ 在真實世界的應用程式中利用特徵工程
【下載範例程式檔案】
本書的程式碼是由GitHub託管,可以在如下網址找到:github.com/PacktPublishing/Feature-Engineering-Made-Easy。
【下載本書的彩色圖片】
我們還提供您一個PDF檔案,其中包含本書使用的彩色圖表,可以在此下載:www.packtpub.com/sites/default/files/downloads/FeatureEngineeringMadeEasy_ColorImages.pdf。