新到貨2本75折
深度強化學習算法原理與實戰:基於MATLAB

深度強化學習算法原理與實戰:基於MATLAB

  • 定價:654
  • 運送方式:
  • 臺灣與離島
  • 海外
  • 可配送點:台灣、蘭嶼、綠島、澎湖、金門、馬祖
  • 可配送點:台灣、蘭嶼、綠島、澎湖、金門、馬祖
載入中...
  • 分享

 

內容簡介

本書在詳細闡述強化學習基本概念與基本理論的基礎上,循序漸進地介紹了深度強化學習各常用算法的基本思想、算法偽代碼、算法實現、基於實例的算法演示與程序分析等內容。具體介紹了Q-learning算法求解很優路徑問題,SARSA算法求解很優安全路徑問題,策略迭代算法求解兩地租車很優調度問題,價值選代算法求解很優路徑問題,DQN算法求解平衡系統的很優控制問題,PG算法求解雙積分系統的很優控制問題,AC類算法求解股票交易的很優推薦策略,SAC算法求解機器人手臂控球平衡問題,PPO算法求解飛行器平穩着陸很優控制問題,DDPG算法求解四足機器人行走控制策略問題,TD3算法求解PID控制器參數整定問題,多智能體強化學習的基本概念與基本方法,MAPPO算法求解多智能體協作運送物體問題,IPPO算法與MAPPO算法求解協作競爭探索區域問題,MADDPG與DDPG算法求解車輛路徑跟蹤控制問題。





 

詳細資料

  • ISBN:9787122475756
  • 規格:平裝 / 339頁 / 普通級 / 1-1
  • 出版地:中國

最近瀏覽商品

 

相關活動

  • 【自然科普、電腦資訊】AI時代的職場生存術:打開職場新思維,打造新世代職場競爭力,電子書85折起
 

購物說明

溫馨提醒您:若您訂單中有購買簡體館無庫存/預售書或庫存於海外廠商的書籍,建議與其他商品分開下單,以避免等待時間過長,謝謝。

大陸出版品書況:因裝幀品質及貨運條件未臻完善,書況與台灣出版品落差甚大,封面老舊、出現磨痕、凹痕等均屬常態,故簡體字館除封面破損、內頁脫落...等較嚴重的狀態外,其餘所有商品將正常出貨。 

 

請注意,部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

調貨時間:若您購買海外庫存之商品,於您完成訂購後,商品原則上約21~30個工作天內抵台(若有將延遲另行告知)。為了縮短等待的時間,建議您將簡體書與其它商品分開訂購,以利一般商品快速出貨。 

若您具有法人身份為常態性且大量購書者,或有特殊作業需求,建議您可洽詢「企業採購」。 

退換貨說明 

會員所購買的商品均享有到貨十天的猶豫期(含例假日)。退回之商品必須於猶豫期內寄回。 

辦理退換貨時,商品必須是全新狀態與完整包裝(請注意保持商品本體、配件、贈品、保證書、原廠包裝及所有附隨文件或資料的完整性,切勿缺漏任何配件或損毀原廠外盒)。退回商品無法回復原狀者,恐將影響退貨權益或需負擔部分費用。 

訂購本商品前請務必詳閱商品退換貨原則

  • 羅振宇新作79折
  • 百大2本75折
  • 商業新品79折起